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摘 要 基于 35 项 实证 研究 ,遵循 诊断 准确 性 研究 的 质量 评估 (QUADAS-2) 的 循 证 程序 对 自 闭 症 谱 系 早期 预 
警 特 征 筛 查 工具 开展 质量 评估 ， 包 括 婴 儿 阶 段 (10 A $$ BLA, 159388 人 )、 幼 儿 阶 段 (14 Whip BOA, 11712A), 
旨 在 为 自 闭 症 谱系 风险 的 早期 识别 提供 全 面 的 理解 。 结 果 表 明 : 幼儿 阶段 的 筛 查 工具 的 分 类 准确 性 要 高 于 婴 
儿 阶 段 ， 在 婴儿 阶段 达到 良好 水 平 的 得 查 工具 有 M-CHAT-R/F, PDQ-1; 在 幼儿 阶段 达到 优秀 水 平 的 得 查 工具 
有 OERA、TIDOS。 其 中 , “改良 的 幼儿 自 闭 症 检查 表 一 有 修订 的 后 续 随 访 ”(M-CHAT-R/F) 是 目前 最 具 潜 力 的 自 
闭 症 谱系 风险 盘查 工具 之 一 。 最 后 ， 我们 探讨 了 应 用 QUADAS-2 评估 研究 质量 的 局 限 性 ， 强 调 需 要 规范 工具 
的 质量 评估 标准 与 进一步 验证 研究 的 必要 性 。 
Keil Ae, HALA, 诊断 敏 感性 和 特异 性 , QUADAS-2 
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的 评估 


fiA (screening) 2x. fifi & YE fh Zi *— fp EDGE fij 


旨 在 确定 有 可 


， 能 患 上 某 些 疾病 或 残疾 的 
儿童 、 有 资格 参加 某 些 项 目的 儿童 、 有 需要 补救 


的 疾病 或 残疾 的 儿童 或 需要 更 全 


和 i 评估 的 儿童 ” 


(Sattler，2008)。 检 视 以 往 的 中 文 文献 , 我 们 发 现 
关于 自 闭 症 谱系 早期 筛 查 的 研究 有 两 方面 的 误区 ， 


第 一 个 误区 表现 在 对 于 “ 筛 查 ”的 概念 和 操作 规范 
的 认 知 不 足 ， 常 将 之 与 “诊断 ”和 “评估 ” 放 在 一 起 


GKI, DLAI, 2001), 没有 明确 区 分 “第 查 ”作为 
一 个 独立 而 重要 的 阶段 来 开展 广泛 深入 性 的 研 
究 。 首 先 , 我 们 根据 《特殊 教育 辞典 》 的 概念 界 


XE (Fh ok I, 2014)2k UE B] — E BU DC “iiA 


步 做 全 面 细致 的 专业 检查 。 
译 为 “评估 ”、“ 评 定 ”， 是 由 相应 的 机 构 或 专业 人 员 


“鉴定 (assessment) ”又 


“a 


一 定 的 方法 对 疑似 特殊 儿童 进行 各 种 必要 检查 
并 做 出 结论 的 过 程 。 其 次 ， 从 操作 流程 上 ， 筛 查 发 


生 在 正规 诊断 之 前 ， 租 查 前 的 转 介 可 能 来 自 产 前 


检查 


、 新 生 儿 筛选 、 儿 童 保健 门诊 、 社 区 护士 、 


医院 门诊 、 公 立 或 民办 幼儿 园 、 学 前 教育 机 构 或 


托儿所 、 儿 童 福利 机 构 及 托 育 中 心 、 家 长 或 监护 
报 ( 何 华 国 ,2006)， 筛 查 是 
是 或 不 是 某 类 特殊 需要 儿童 ( 王 


人 、 保 姆 等 多 元 化 的 通 
H T 3 B HE LE 


WE, 2015), S ALLE fi A MARIE RAE ATA IL 


不 是 自 


闭 症 或 者 可 能 是 自 闭 症 , 但 可 以 有 效 地 提 


高 之 后 自 闭 症 诊断 的 准确 性 和 可 靠 性 。 正 规 诊断 


(screening)”" 是 在 大 量 儿 童 中 发 现 特殊 儿童 (主要 
是 残疾 儿童 ) 的 一 种 检测 活动 。“ 诊 断 (diagnosis) ” 
是 对 筛 查 出 的 特殊 儿童 或 怀疑 为 特殊 的 儿童 进 一 
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日 的 测 查 工具 更 复杂 ， 操 


受过 训练 取得 合格 证 书 的 专业 人 员 进 行 , 使 


作 程 序 更 严格 和 标准 


化 。 诊 断 结果 应 有 书面 结论 ， 包括 特殊 儿童 的 类 
型 、 性 质 、 程 度 、 诊 断 时 间 、 地 点 、 测 查 人 员 签 


A RUDI A 


位 善 章 。 而 评估 是 一 个 多 层面 的 过 程 ， 


这 个 术语 在 特殊 教育 领域 中 应 用 更 为 宽泛 ， 特 殊 
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L 童 的 评估 一 般 昌 


日 特殊 教育 学 、 


特殊 心理 学 、 有 


关 医 学 等 方面 专家 和 教育 行政 部 门 代表 、 教 师 以 
及 家 长 共同 参加 。 评 佑 过 程 通常 包含 如 下 目的 : 


fifi E 


诊断 与 安置 、 帮 助 制定 个 别 教育 计划 ， 帮 
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助 确定 学 生 的 进步 情况 并 判断 有 关 教 育 干预 措施 
的 有 效 性 ( 方 俊明 , 2005)。 

另 一 个 误区 是 ， 对 得 查 工 具 开 发 和 使 用 目的 
的 理解 不 到 位 。 例 如 ， 有 一 部 分 研究 者 混淆 了 “ 筛 
查 工具 ”和 “诊断 工具 ”的 界限 , 将 金 标准 意义 的 
ADI-R 和 ADOS 这 两 项 “临床 诊断 工具 ”简单 地 等 
le] Psi ze LR" GKK, RB, 2013; 冯 雅 静 ， 
EHE, 2012)。 筛 查 工 具 使 用 的 重点 在 于 其 “简短 ”、 
“经 济 ”、“ 快 捷 ”、“ 准 确 ? 地 早期 识别 目的 和 功能 ， 
而 不 能 被 看 作 是 ASD 的 诊断 工具 ， 因 为 正规 的 诊 
断 必须 严格 遵循 DSM zX ICD 的 诊断 标准 ， 只 有 执 
业 医 师 在 必要 的 临床 环境 中 ,借助 “ADI-R” 和 
“ADOS” 的 临床 诊断 工具 的 同时 ,还 要 进行 大 量 
的 身体 和 行为 测试 , 才 有 资格 对 自 闭 症 做 出 正规 
诊断 。 经 过 正规 诊断 的 孩子 才 有 资格 获得 政府 和 
保险 机 构 的 支持 和 资源 ,进而 安排 早期 干预 治疗 
和 教育 安置 工作 。 在 这 个 角度 来 看 ，ASD 的 诊断 
是 非常 复杂 、 主 观 、 耗 时 且 昂 贵 的 , 但 最 为 关键 
的 是 ， 科 查 过 程 需要 由 后 续 的 诊断 结果 来 评判 得 
查 工 具 的 准确 性 ,正如 许多 研究 者 所 建议 的 
(Falkmer et al., 2013; Volkmar et al., 2014),“ 早 期 
筛 查 的 过 程 应 该 包括 早期 盘查 预 警 信 号 和 通过 临 
床 判断 做 出 的 后 续 诊 断 ， 并 结合 应 用 可 靠 和 标准 
化 的 金 标准 测量 ,例如 ，ADLR; ADOS-2”。 因 此 ， 
诊断 工具 与 筛 查 工具 不 能 相互 替代 。 另 外 ,还 有 
部 分 研究 者 将 “得 查 工具 ”等 同 于 “评估 工具 ”( 王 
we 等 , 2009)“ 测 评 工具 ”( 周 念 丽 ， 方 俊明 , 2008), 
首先 ， 这 一 误解 在 于 忽视 了 得 查 工 具 在 临床 诊断 
和 教育 评估 中 的 重要 意义 。 它 不 仅 可 以 帮助 家 长 
和 从 业者 尽早 识别 自 闭 症 风险 行为 ,加 快 临床 诊 
断 转 诊 流 程 ,而且 有 助 于 提高 不 同 利益 相关 者 ( 父 
母 、 照 顾 者 、 教 师 和 家 庭 成 员 等 ) 对 自 闭 症 的 理解 ， 
改善 公众 对 自 闭 症 的 认 知 。 其 次 , 这 一 误解 在 于 
没有 辨识 到 早 发 现 与 早 诊 断 之 间 的 渐 近 性 ， 这 对 


的 效果 ,而 且 有 增加 的 证 据 表明 , 筛 查 的 确 会 降 
低 诊断 年 龄 。 如 Carbone 等 人 (2020) 发 现 ， 早 期 得 
查 阳性 的 儿童 被 诊断 ASD 的 时 间 要 比 筛 查 阴 性 
的 儿童 早 12 个 月 ， 比 未 参加 筛 查 的 儿童 早 10 个 
月 。 因 此 ,开展 自 闭 症 谱系 早期 第 查 目的 在 于 尽 
早 发 现 疑 似 自 闭 症 谱系 症状 的 婴 幼 儿 ， 通过 接受 
基本 的 测试 ,以 确定 其 是 否 需要 进一步 的 诊断 评 
估 和 早期 干预 。 通 过 这 一 系列 渐进 性 的 早 识别 ， 
早 诊 断 ， 早 干预 过 程 不 仅 可 以 增强 自 闭 症 谱系 障 
碍 儿童 的 适应 能 力 (Dawson et al., 2010), 提高 他 
们 的 社交 能 力 (Leo et al., 2019), 预防 继 发 性 发 育 
障碍 (Reichow et al, 2012), 更 有 助 于 减轻 家 庭 的 
压力 (Renty & Roeyers，2006) 和 降低 社会 成 本 
(Lecciso et al., 2013)。 

由 于 2013 年 美国 精神 病 学 会 修订 了 《精神 障 
碍 诊断 及 统计 手册 》 第 五 版 (the Diagnostic and 
Statistical Manual of Mental Disorders-5th Edition, 
DSM-5)， 并 采用 单一 分 类 概念 来 定义 自 闭 症 谱系 
障碍 ,这 一 自 闭 症 临床 诊断 标准 上 的 巨大 变化 不 
仅 对 自 闭 症 的 发 病 率 、 诊 断 、 治 疗 及 预后 其 他 相 
关 领 域 产生 深远 影响 ( 陈 文 雄 ，2013)， 更 对 确定 
ASD 筛 查 行为 特征 提出 了 极 大 的 挑战 。 因 此 ， 对 
现 有 的 自 闲 症 风险 筛 查 工 具 进行 质量 分 析 显 得 十 

在 过 去 的 十 几 年 里 ,已 经 有 19 篇 英文 文献 综 
述 对 早期 发 现 自 朵 症 风险 的 筛 查 工具 的 评估 标准 
进行 了 深入 分 析 , 我 们 将 这 些 综述 文献 的 优势 和 
不 足 归纳 为 五 大 方面 。 在 文献 检索 的 全 面 性 上 ， 
部 分 综述 的 结论 仅 搜 索 了 1~3 个 数据 库 ， 甚 至 是 
完全 基于 经 验 性 分 析 的 (Charman & Gotham, 2013; 
Thabtah & Peebles, 2019); 在 研究 的 地 域 分 布 上 ， 
19 篇 综述 侧重 于 欧洲 或 美国 等 特定 地 理 区 域 
(Garcia-Primo et al., 2014; Levy et al., 2020), 来 自 
亚 非 拉 国 家 的 研究 相对 少见 (Soleimani et al., 


>| W 


于 避免 诊断 延迟 ， 尽 早 干预 至 关 重 要 。 美 国父 母 
通常 会 在 24 个 月 前 发 现 并 表示 孩子 可 能 患 有 自 
闭 症 的 担忧 (CDC, 2012)， 中 国家 长 注意 到 症状 并 
寻求 诊断 的 时 间 平 均 在 35 个 月 (Zhou et al., 
2014)， 然 而 ， 只 有 4 FES 8 岁 以 后 才能 确诊 
(CDC, 2014), 在 有 色 人 种 儿童 和 农村 及 低 收 入 家 
庭 儿 童 的 诊断 年 龄 甚至 更 晚 (Mandell et al, 
2010)。 为 了 摆脱 诊断 延迟 的 困境 , 保健 工作 者 和 
其 他 专业 相关 人 员 重 点 关注 了 定期 使 用 发 育 筛 查 


2014); 在 专业 范畴 上 , 则 集中 于 医学 和 儿科 学 研 
究 (Wang et al., 2020; Zwaigenbaum et al, 2015) 及 
公共 卫生 领域 (Stewart & Lee, 2017)， 基 于 心理 学 
和 脑 神 经 科学 的 专业 指向 较 少 涉及 (Marlow et al., 
2019)。 在 盘查 工具 从 开发 到 实施 所 涉及 的 重要 指 
标 上 ， 除 了 如 上 谈 到 的 筛 查 工 具 要 符合 DSM-5 的 
规范 外 , 还 有 很 多 评估 指标 ， 如 筛 查 样 本 的 类 型 
或 应 用 水 平 (一 级 筛 查 或 是 二 级 盘 查 )、 筛 查 信息 来 
源 (父母 或 看 护 者 的 报告 , 或 是 观察 孩子 的 现场 
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(录像 ) 互 动 )、 抽 样 儿 童 的 年 岭 和 发 育 水 平 、 筛 查 
的 实用 性 (如 管理 时 间 、 工 具 的 管理 和 评分 、 筛 查 
人 员 的 培训 、 转 诊 和 随访 结果 管理 等 )、 区 分 其 他 
障碍 的 测量 学 特性 (如 敏感 性 和 特异 性 、 可 鉴别 性 
指标 等 )、 心 理 测量 学 特性 ( 重 测 信 和 度 和 评分 者 信 
度 、 效 度 等 )、 文 化 适应 性 、 目 标 受众 的 可 理解 性 
和 欢迎 程度 、 网 络 和 移动 设备 的 可 访问 性 等 10 余 
项 , 但 大 多 数 综述 只 选择 了 2-3 个 指标 , 开展 全 
部 指标 的 评估 较为 困难 。 最 后 ,在 综述 分 析 所 采 
用 的 研究 方法 上 , 除 Hampton 和 Strand (2015), 
Sánchez-García 等 (2019)、Yuen 等 (2018) 等 三 个 人 研 
究 小 组 采用 元 分 析 的 方法 或 应 用 贝 叶 斯 层次 模型 
来 评估 与 准确 性 、 心 理 测量 学 特性 相关 的 结果 外 ， 
大 多 数 综述 没有 全 面 分 析 盘 查 工具 的 心理 测量 学 
和 测量 学 特性 。 
对 自 闭 症 风险 信号 的 早期 筛 查 是 一 项 极为 艰 
巨 的 任务 ,来 自 不 同学 科 背 景 ( 如 遗传 学 、 神 经 科 
学 、 精 神 病 学 、 心 理学 、 病 毒 学 ) 的 自 闭 症 研 究 人 
员 的 共同 目标 在 于 确定 能 够 在 婴儿 期 和 幼儿 期 可 
靠 检测 到 的 行为 标志 物 ， 并 将 其 纳 和 人 筛 查 测量 中 ， 
但 是 不 同 的 衡量 标准 对 筛 查 工具 的 质量 评价 有 不 
同 的 界定 ,不 同 盘查 工具 在 目标 行为 的 操作 性 和 
获取 信息 的 方式 上 也 有 所 不 同 。 虽 然 以 往 的 综述 
为 我 们 理解 第 查 工具 的 功能 和 内 容 评价 提供 了 良 
好 的 基础 , 但 也 显露 出 其 在 质量 评价 完整 性 上 的 


不 足 。 本 研究 对 发 表 于 2013~2020 年 间 的 适合 学 
前 阶段 儿童 自 闭 症 谱系 第 查 工具 进行 了 批判 性 评 
佑 ,以 识别 其 优点 、 性 能 问题 和 缺点 。 具 体 的 研 
究 问题 包括 : (1) 从 应 用 水 平 、 心 理 测量 学 特性 、 
文化 适应 性 、 符 合 诊 断 标准 等 多 指标 切入 ,详细 
地 介绍 了 这 些 自 闭 症 谱系 第 查 工具 的 特征 表现 ; 
(2) 通 过 综合 比较 婴儿 和 幼儿 年 龄 阶段 第 查 工具 在 
敏感 性 和 特异 性 数据 ， 探 讨 是否 有 一 个 (或 多 个 ) 
有 和 希望 用 于 早期 第 查 自 闭 症 风险 的 工具 


2 研究 方法 


2.1 文献 搜索 策略 

采用 基于 系统 评价 和 元 分 析 (PRISMA) 指 南 
来 确定 需要 纳入 研究 的 论文 构成 (Moher et al., 
2009; Siddaway et al, 2019)， 应 用 的 英文 主题 词 是 : 
‘ASD screen*’, ‘ASD detect*’, ‘ASD or autism or 


autist*’, ‘screening tool’, ‘Early identification’, 


~~ 


“assessment tool’, ‘assess*’, ‘instrument*’, ‘measure*’, 
‘tool*’, L1*2013 年 1 月 ~2020 年 12 月 之 内 ”和 
“English 英语 ”作为 高 级 过 滤 词 。 分 别 从 3 个 综合 
性 文摘 检索 数据 库 (WOS 、SCOPUS PubMed 等 ) 
检索 到 相应 文献 ， 通 过 链接 进入 APA/EBSCO 、 

ScienceDirect, Sage, Springlink, Wiley Online 
Library 电子 期 刊 数据 库 ， 获 取 5535 篇 文献 ， 如 图 1 
所 示 。 电 子 搜索 是 由 第 二 和 第 三 作者 进行 的 ， 他 


通过 对 数据 库 的 检索 得 到 的 相应 文献 数量 (n=5535) 


通过 手工 检索 综述 文章 
的 参考 文献 而 得 到 的 文 
献 数 量 (n=16) 


根据 标题 和 摘要 ， 排 除 文献 的 数量 (n=5376) 


初 第 后 得 到 的 文献 数量 (n=159) 


全 文 文章 评定 合格 的 文献 数量 (n=175) | 一 >| 排除 文献 的 数量 (n=140) 


综合 


| 


进行 定性 综合 研究 的 文献 数量 (n=35) 


All 纳入 ASD 筛 查 工具 综述 的 PRISMA 流程 图 


c— 
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们 提取 了 这 些 文献 记录 ,并 将 参考 资料 制 成 表格 ， Autism Spectrum Tesb 建 议 将 临界 值 设 为 15 分 


放 在 excel 文件 中 。 第 一 作者 依据 长 期 从 事 自 闭 症 
认 知 研究 和 教学 实践 经 验 ， 预先 制定 了 文献 纳入 / 
排除 标准 ， 所 有 作者 共同 仔细 阅读 这 些 引文 的 标 
题 和 摘要 后 ， 删 除 重 复 .不 合格 论文 ， 获 取 初 得 后 
文献 159 篇 。 此 外 ， 从 已 经 发 表 的 “ 自 闭 症 谱系 得 
查 ” 综 论文 章 的 参考 文献 和 引文 中 进行 二 次 手工 
搜索 ,也 对 同一 主题 的 其 他 评论 进行 了 检查 ， 提 
取 符 合 我 们 研究 的 原创 性 研究 文献 16 篇 ,共计 纳 
入 质量 评估 的 文献 175 篇 。 之 后 , 根据 纳入 /排除 
标准 ， 删 除 文献 120 篇 ,根据 质量 评估 标准 的 偏 
倚 风 险 的 高 低 ， 删 除 高 风险 文献 20 篇 ， 最 后 纳入 
全 文 定性 综合 分 析 的 文献 35 篇 。 

同时 , 我 们 也 应 用 中 文 主题 词 :“ 自 闭 症 谱系 
Hite’, MA and/or ive’, ‘fi TR. and/or ffi T. 
Ho, ‘AVE and/or 孤独 证 等， 获取 中 文 文章 37 
篇 。 但 是 , 根据 文献 纳 人 标准 , 排除 23 篇 文章 : (1) 
综述 性 文献 (n = 2); (2) 年 龄 范围 (0~6 岁 ) 以 外 的 样 
本 群体 m = 4); (3) 不 是 以 筛 查 为 目的 研究 (n = 
17), ün, 干预 效果 的 说 明 , 测量 工具 信和 度 效 度 的 
比较 ， 筛 查 模式 和 管理 的 评价 ， 对比 其 他 发 育 障 
碍 的 流行 病 学 等 ; 根据 质量 评估 标准 的 偏 傈 风险 
的 高 低 ， 排 除 偏 傈 风险 较 高 风险 14 篇 文章 。 这 些 
中 文 文章 的 偏 倚 风 险 主 要 体现 在 诊断 标准 和 文化 
适应 性 上 ， 如 在 筛 查 的 结果 需要 有 明确 的 ASD 诊 
WME, 虽然 基本 符合 了 “基于 国际 疾病 分 类 (ICD) 
和 /或 美国 精神 障碍 诊断 和 统计 手册 (DSM) 的 框 
jg", 但 在 专家 临床 判断 上 , 没有 研究 应 用 了 可 靠 
和 标准 化 的 金 标 准 测量 , ADI-R 或 ADOS-2; 也 没 
有 关于 评估 员 或 诊断 者 的 资格 或 培训 信息 的 报告 ， 
如 陈述 为 “以 临床 医生 根据 DSM-V 作 出 的 临床 
诊断 作为 金 标准 ”( 獒 郁 查 等 , 2015); 同时 ， 大 部 
分 研究 因 未 提供 足够 的 分 类 准确 性 数据 ( 骆 名 进 
等 ，2020)， 无 法 确定 用 于 识别 自 闭 证 儿童 的 筛 查 
工具 的 有 效 性 。 其 次 , 在 文化 适应 和 管理 上 ， 虽 然 
少 部 分 研究 报告 了 翻译 、 回 译 的 文化 适应 性 调整 ， 
但 对 量 表 项 目 数量 的 改变 和 临界 取 值 的 改变 , 造 
成 对 这 些 工 具 的 使 用 和 分 析 更 加 复杂 ， 使 用 不 同 
的 版 本 或 评分 算法 也 导致 我 们 无 法 标准 化 地 提取 
相应 数据 ， 如 关 智 勇 等 (2016) 年 采用 CAST 中 文 
修订 版 (37 项 ) 发 现 , 对 3~< 4 岁 儿 童 孤 独 症 CAST 
MAEL 17 SAH, 而 由 英国 剑桥 大 学 Baron 
Cohen 团队 开发 研制 的 原版 CAST (Childrenhood 


(Scott et al., 2002)， 而 许 丹 等 (2013) 的 CAST 中 文 
修订 版 项 目 数量 是 25 项 ， 少 于 英文 原文 37 项 ,但 
结果 建议 将 16 分 作为 CAST 中 文 版 的 临界 值 。 由 
此 ,我 们 认为 ， 可 以 考虑 单独 设计 基于 中 文 相关 
研究 成 果 的 质量 分 析 标 准 ， 开 展 专项 研究 ， 不适 
合 纳入 本 文 并 与 英文 同类 文献 和 工具 进行 横向 比 
较 。 因 此 ,在 本 综述 中 ,并 没有 开展 基于 中 文 筛 查 
工具 的 深度 分 析 。 
2.2 ”纳入 和 排除 标准 

正式 确定 的 纳入 标准 包括 : (1) 在 第 一 次 电子 
搜索 中 确定 的 “ 自 闭 症 谱系 障碍 盘查 工具 ”是 重点 ; 
(2) 研 究 发 表 为 “全 文 原创 文章 ”(3) 在 同行 评审 共 
刊 上 发 表 的 论文 ; (4) 研 究 样本 重生 的 年 龄 范围 为 
0-6 岁 ; (5) 研 究 样 本 是 被 监测 ASD 症状 的 个 体 ， 
即使 他 们 有 另 一 个 主要 诊断 (例如 ， 如 果 探 索 筛 查 
工具 的 测量 特性 ， 监 测 “ 脆 性 X 人 和 群 * 表 现 出 ASD 
症状 的 论文 也 是 合格 的 ); (6) 研 究 目 的 是 开发 一 种 
测量 工具 或 评估 其 一 种 或 多 种 测量 特性 的 论文 ， 
研究 结果 强调 使 用 盘查 工具 评估 ASD 的 准确 度 
相关 ， 则 将 其 纳入 ; (7) 样 本 量 大 于 等 于 30 人。 

排除 标准 包括 : (1) 只 以 “诊断 ”为 目的 研究 的 
文章 、 对 行为 改变 、 进 展 或 干预 反应 效果 进行 测 
量 的 文章 (n = 24); (2) 以 区 分 发 育 障碍 或 其 他 类 型 
障碍 (如 智力 障碍 或 ADHD 等 ), 而 不 是 第 查 ASD 
为 目的 的 研究 (n = 23); (3) 针 对 ASD 的 流行 病 学 
研究 和 专家 指南 ， 生 物 标志 物 、 功 能 磁 共 振 成 像 、 
血液 检测 、 基 因 表 达 谱 、 共 病 、 工 具 的 机 器 学 习 
算法 等 非 本 研究 能 力 所 及 的 检测 程序 (n = 27); (4) 
综述 ,文摘 ,报道 ,会 议论 文 等 回顾 性 研究 , 非 原 
创 性 研究 文献 (n = 21); (5) 年 龄 范围 (0~6 岁 ) 以 外 
的 样本 群体 ， 无 法 区 分 年 龄 阶段 的 (n = 20); (6) 非 
英文 (n = 2); (7) 无 法 获取 全 文 (n = 3)。 
23 ”质量 评估 的 标准 和 评分 者 信和 度 

QUADAS-2 (Quality Assessment of Diagnostic 
Accuracy Studies-2, 诊断 准确 性 研究 的 质量 评估 
-2) 是 广泛 用 于 行为 、 医 学 领域 (McDonald et al., 
2015; Stout et al.,，2015)， 针 对 诊断 和 筛 查 测量 文 
献 开展 质量 评价 的 工具 (Whiting et al., 2011), 包 
括 诊断 准确 性 研究 中 观察 到 的 最 重要 的 偏差 和 变 
异 来 源 。 在 本 研究 中 ,遵循 QUADAS-2 的 循 证 程 
FR, 完成 175 篇 英文 文献 的 质量 标准 评估 。 首 先 ， 
对 给 定 的 关于 筛 查 工 具 的 调查 问题 进行 了 调整 : 
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(将 被 试 样本 量 、 符 合 参考 标准 (诊断 金 标 准 )、 
流程 和 时 间 ,心理 测量 学 指标 (信和 度 和 效 度 ) 和 分 类 
准确 性 指标 (敏感 性 和 特异 性 等 ) 作 为 偏 倚 风 险 维 
度 审 查 维度 ; (2) 为 每 个 领域 开发 了 探究 性 问题 ， 
并 分 配 了 是 /和 否 评分 。 第 二 ， 对 问题 的 实用 性 进行 
实地 测试 ， 即 由 三 位 作者 从 175 篇 文章 中 随机 选 
AE 3 篇 , 背 对 背 仔 细 阅 读 全 文 ,并 将 探究 性 问题 
应 用 于 每 个 研究 ,在 不 同 的 excel 文 件 中 报告 了 他 
们 的 决定 ， 并 对 他 们 的 发 现 进行 了 逐条 记录 的 比 
BE WA RIM, 由 第 三 提交 人 仲裁 , 最 后 统一 大 家 
的 共识 。 


3 结果 


3.1 ”纳入 研究 的 方法 学 质量 分 析 

我 们 使 用 QUADAS-2 质量 评估 研究 工具 和 
评分 者 信和 度 系数 来 检验 纳入 研究 总 体质 量 分 数 和 
评分 者 之 间 的 一 致 性 ,并 通过 讨论 解决 任何 项 目 
差异 。 由 第 一 作者 另外 培训 两 名 不 了 解 研 究 目的 
的 研究 生 作 为 独立 评分 者 ， 帮 助 每 名 评分 者 准确 
了 解 QUADAS-2 所 涉及 审查 维度 的 定义 ， 明 确 对 
应 探究 性 问题 的 范围 ， 能 准确 掌握 评分 的 技巧 和 
方法 , 与 前 三 位 作者 共同 完成 175 篇 文章 的 全 文 
质量 评 佑 。 根 据 质量 评估 标准 的 偏 倚 风 险 维度 : 
被 试 样本 量 、 诊 断 标 准 、 分 类 准确 性 、 心 理 测量 
指标 ,删除 高 风险 文献 20 篇 ,最 后 ， 随 机 选择 175 
篇 文献 中 的 50 篇 , 采用 人 徐 建 平 和 张 厚 染 (2005) 提 
出 的 “ 归 类 一 致 性 公式 ”计算 出 评分 者 信 度 在 
0.64~0.94 之 间 , 总 的 归 类 一 致 性 为 0.75; 编码 信 
度 系数 值 在 078-027 <M, 总 体 编码 信和 度 系数 为 
0.86, 这 表明 了 本 次 质量 评估 的 评分 者 信 度 具有 
公平 到 良好 的 一 致 性 水 平 。 

3.2 ”适合 学 前 儿童 自 闭 症 风险 预警 特征 的 得 查 
工具 概述 

为 了 全 面 清晰 地 掌握 学 前 儿童 自 闭 症 风险 第 
查 工 具 的 基本 特性 ,我 们 分 别 报告 了 筛 查 工具 的 
名 称 、 作 者 国 别 和 研究 年 份 、 样 本 特征 、 应 用 水 
平 、 心 理 测量 学 特性 、 文 化 适应 性 和 诊断 标准 、 
筛 查分 类 的 准确 性 等 情况 。 

我 们 从 质量 评估 后 的 35 篇 文献 中 提取 出 筛 
查 工 具 18 项 , 表 1 和 表 2 分 别 报告 了 每 项 蔓 查 工 
具 的 基本 内 容 和 发 表 文 献 的 一 般 细 节 。 在 2013 年 ~ 
2020 年 的 7 年 间 ,， 文献 发 表 时 间 在 2019 年 最 多 , 9 
fai, 其 次 是 2014 年 6 $8, 2018 年 5 篇 , 平均 每 年 


发 表 文 献 数量 是 4 篇 。 在 地 点 上 , 大 多 数 研 究 (n = 
16) 是 在 美洲 进行 的 , 12 项 在 美国 。 来 自 亚 洲 国 家 
的 研究 有 12 39, 5 项 在 中 国 ， 欧 洲 的 研究 有 7 项 ， 
意大利 有 2 项 。 按 照 筛 查 儿 童 样本 的 年 龄 范围 划 
分 为 两 个 年 龄 阶段 ， 有 21 项 研究 中 使 用 了 10 项 
METRIT 0-3 岁 婴 儿 的 自 闭 症 风险 , 样本 
平均 数量 4047 A, 性 别 比例 男 童 大 于 女童 
(3101:1937'); 样本 取样 的 平均 年 龄 范围 在 15.62~ 
26.94 ^ H (M = 20.62)’; E 3-6 岁 的 幼儿 阶段 ， 
18 项 研究 使 用 了 14 项 工具 ”分析 了 自 闭 症 风险 特 
fE, 参与 儿童 的 平均 数量 是 606 A, 性 别 比 例 男 
童 大 于 女童 (371:235); 样本 的 平均 年 龄 范围 在 
22.36-51.97 个 月 (M =37.26), 见 表 3、 表 4。 
3.2.1 ” 筛 查 工具 在 应 用 水 平 上 的 表现 

自 20 世纪 90 年 代 末 开始 专门 针对 自 闭 症 进 
行 筛 查 工具 的 研制 ， 主 要 是 根据 得 查 样 本 的 类 型 
划分 为 一 级 和 二 级 盘查 两 种 应 用 水 平 。 一 级 得 查 
(Level D 适 用 于 未 经 选择 的 一 般 人 群 儿 童 ， 无论 
其 风险 状况 如 何 。 二 级 科 查 (Level ID 针对 的 是 已 
经 被 确定 为 发 育 障 碍 儿童 的 筛 查 (例如 ， 有 自 闭 证 
谱系 家 族 史 、 父 母 或 临床 医生 提出 了 担忧 、 经 过 
一 级 筛 查 鉴 定 为 阳性 者 )。 但 我 们 在 梳理 文献 的 过 
程 中 发 现 ,实践 中 对 测量 工具 的 应 用 水 平 并 没有 
那么 明晰 的 区 分 界限 ,借鉴 Robins E 
Dumont-Mathieu (2006) M-CHAT 作为 同时 应 
i ITE. 
(hybrid)” 工 具 的 应 用 水 平 ， 即 指 那些 同时 应 用 于 
一 般 人 群 (一 级 筛 查 ) 和 临床 样本 (二 级 筛 查 ) 的 得 
ATH, ILK 2。 

在 本 研究 中 , 我 们 发 现 了 4 个 一 级 盘查 工具 
A: 改良 的 幼儿 自 闭 症 检查 表 (M-CHAT); 第 一 年 
调查 (FYD; 心理 发 展 问卷 -1 (PDQ-D; Á AER 


| 作者 注 : 4 项 研究 性 别 有 缺 失 值 ， 因 此 ， 男 童 与 女童 合计 
THES 总 样本 平均 值 相 差 13 A, 详 见 表 3 

“作者 注 : 在 婴儿 阶段 , 平均 抽样 年 龄 的 最 小 值 是 16 个 月 ， 
只 有 2 项 研究 的 实际 抽样 年 龄 在 16 个 月 前 (Sacrey et al, 
2018; Turner-Brown et al, 2013), {Hix 2 NOSE ZETA TA 
和 取样 年 龄 均 不 相同 ， 因 此 ,无 法 详细 介绍 指向 16 个 月 前 
ii LE. 
:作者 注 : 有 4 篇 文献 采用 的 是 纵向 追踪 设计 M-CHAT (Toh 
et al, 2018; Koh et al, 2014), M-CHAT-R/F (Mag 4 n-Maganto 
et al, 2020), BISCUIT-Part 1 (Horovitz & Matson, 2014 ) 同 
时 测量 了 婴儿 和 幼儿 两 组 , 所 以 同时 出 现在 表 3 和 表 4 中 。 
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表 2 18 项 自 闭 症 风险 筛 查 工具 在 应 用 水 平 、 心 理 测量 、 文 化 适应 性 和 诊断 标准 方面 的 特征 


— 心理 测量 指标 文化 适应 性 诊断 标准 
工具 名 称 人 研究 者 ， ”应 用 一 -一 — 
i 年 代 KE A o Moos oae ie 
回 译 ”预测 试 ” 相关 测量 [ 具 
M-CHAT (23 项 ) Carbone 等 一 级 NR NR NR E NR NR ICD-9 
(2020)3& E ICD-10 
Toh 等 (2018) 一 级 NR NR AN d NR NR DSM-IV-TR 
马来西亚 
Stenberg 等 ”一 级 NR NR AN VV NR ADI-R ICD-10 
(2014) 挪 威 ADOS DSM-IV 
Koh 等 (2014) 一 级 a: 0.75~0.86 NR AN RI Vineland-II ADOS-G DSM-IV-TR 
y Bayley-III 
ay ne WPPSI-III 
DAS-II 
M-CHAT/F (23 项 ) Guthrie 等 ”一 级 NR NR - - NR NR ICD-9 
x: E ICD-10 
2019)3& E 
PPS DSM-IV 
DSM-5 
Kerub 45 二 级 NR NR VV NR GDS NR DSM-5 
(2020) 以 色 列 
Baduel 等 二 级 NR NR. NN NR PEP-R ADOS-G NR 
(2017) 法 国 VABS 
Sturner 等 一 级 评分 者 信和 度 NR = - MSEL ADOS-2 DSM-IV 
(2016) 美 国 r= 0.866 
Cohen’s 
K=0.72 
Srisinghason 混合 NR NR yy NR MSEL NR DSM-5 
gkram 等 CAT/CLAM 
(2016) 泰 国 S EX Denver IT 
Kamio 等 混合 NR NR VV y TBIS ADI-R DSM-IV-TR 
EADT ADOS 
2014) H AS 
的 用 WISC-II CARS 
M-CHAT-R/F (20 Coelho-Mede 混合 w= 0.889 5 ADOS2 W NR NR ADOS-2 DSM-5 
项 ) iros 等 (2019) 相关 
p: 
SUR r — 0.849 
Magán-Maga 一 级 a: 0.62~0.72 NR NN NY M-PRS ADOS-G DSM-5 
nto 等 (2020) VABS ADOS-2 
Guo 等 (2019) 一 级 a= 0.86 NR NN Y ASQ-3 CARS  DSM-5 
中 国 重 测 信和 度 ASQ-SE 
ICC = 0.759 CARS 
Robins 等 一 级 a=0.79 NR = = CARS-2 ADOS DSM-IV-TR 
AN TASI 
2014% E] 
(2014) 美 国 MSEL 
VABS-II 
BASC-2 
STAT 
Tsai (2019) 混合 a= 0.84 与 CBCL/1%- W *WN CBCL/1%-5 NR DSM-5 
中 国 台 湾 BINE 。 ”5 相关 MBER 
K = 0.33~1 E 
ICC =0.94~0.96 "7 0-37~0.63 
PDQ-1 Zahorodny 等 一 级 EWA BE 与 ABC 相关 一 一 ABC ADI-R DSM-IV-TR 


(2018) 美 国 r=0.997 r = —0.869 MSEL 
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续 表 
mE 心理 测量 指标 文化 适应 性 诊断 标准 
工具 名 称 研究 者 ， ”应 用 i mE Sa Gu 
DEAN y ; - 3i 译 和 FAS LARA iH TOREEN 
年 代 S 3 效 度 诊断 标准 
回 译 ”预测 试 ”相关 测量 TH 
FYI Turner-Brown 一 级 NR NR = E SRS-P ADOS  DSM-IV 
等 (2013) 美 国 DCQ 
MSEL 
VABS-2 
RC_ASRS Zhou 等 2018) 一 级 a=0.91 Cohen’s NN VV NR NR DSM-5 
中 国 d=2.27 
Q-CHAT Raza 等 2019) 二 级 NR NR = - MSEL ADOS DSM-IV 
加 拿 大 ADLER 
Ruta 等 (2019) 混合 a= 0.84 与 CBCLI VV N GMDS ADOS-2 DSM-5 
意大利 5 相关 p 为 NAUES 
0.29-0.44 
CBCL/1%-5 Rescorla 等 ”二 级 退缩 : a = 0.75 NR = = CDI ADOS-G DSM-IV 
(2019) 美 国 PDP: a = 0.80 MSEL ADI-R 
Limberg 等 ”一 级 NR NR NR NR NR ADOS-G ICD-10 
(2017) 德 国 ABE 
Narzisi 等 混合 重 测 信 度 NR NR y GMDS ADOS-G DSM-IV-TR 
(2013) 意 大 利 r= 0.085 CARS 
评分 者 一 致 性 
r=0.61 
Havdahl 等 二 级 NR NR 一 一 DAS-II 或 ADOS DSM-IV-TR 
(2016) 美 国 MSEL ADI-R 
CPRS-R 
SCAS 
MASC 
VABS-II 
STAT Wu 等 (2020) 二 级 a=0.9 NR NR NR MSEL ADOS DSM-5 
中 国 台湾 
Chiang 等 二 级 评分 者 信和 度 NR NR y MSEL ADOS DSM-IV 
(2013) 中 国 r=0.90 DSM-IV-TR 
4s yay 
mis 
APSI Sacrey 等 二 级 a: 0.77~0.92, NR z - AOSI ADOS DSM-IV-TR 
(2018) 加 拿 大 AVE RE MSEL ADIR: 
r: 0.35~0.94 VABS 
BISCUIT-Partl Horovitz fil 二 级 NR NR = - BDI-2 NR DSM-IV-TR 
Matson M-CHAT 
(2014) E] 
ADEC Hedley 等 二 级 a = 0.8; 评分 ADEC 总 分 与 ”一 一 CARS2-ST ADOS-2 DSM-5 
Ms cra : MSEL ADI-R 
(2015) 美 国 者 信和 度 CARS2-ST 和 ARRS 
ICC = 0.95 ”ADOS-2 相关 VinelandlI 
K:0.43-0.89  0.58-0.70 BayleyIII 
AMSE Cederlund 二 级 NR NR 一 一 VinelandII DISCO-1 ICD-10 
(2019) 瑞 典 WPPSI 系列 1 
M-PRS 
BSITD-3 
RITA-T Choueiri 和 二 级 NR 与 ADOS-G - = M-CHAT ADOS-G DSM-IV 
Wagner 相关 MSEL DSM-5 
(2015) 美 国 


r=0.79 
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续 表 
mE 心理 测量 指标 文化 适应 性 诊断 标准 
‘i wee, — "M : - : 
工具 名 称 年 代 XY js J 转译 和 审查 与 ”发 育 及 其 他 诊断 Ll 
信 度 效 度 HRS i 诊断 标准 
回 译 ”预测 试 ” 相关 测量 工具 
DCI Janvier 等 二 级 NR NR = 一 M-CHATR ADOS-2 NR 
SCQ 
2019) 美 国 
(2019) 美 国 MBE 
PAAS Perera 等 混合 重 测 信 度 NR - = NR CARS DSM-5 
(2017) 斯 里 r=0.957 
兰 卡 
TIDOS Oner 等 (2014) 混合 评分 者 一 致 性 NR NR NR SCQ ADOS DSM-IV 
土耳其 0.80 及 以 上 VABS DSM-IV-TR 
OERA Paula 等 (2018) 二 级 评分 者 信和 度 NR = - WISC-IV ADI-R DSM-5 
巴西 K:0.652~0.978 SON-R24-7 


系 评 定量 表 中 文 修订 版 (RC_ASRS)。 这 些 一 级 得 
查 的 工具 主要 是 对 一 般 人 和 群 的 广泛 筛 查 和 其 他 发 
育 障 得 的 检查 ， 主 要 是 基于 父母 报告 的 结果 。 但 
是 ,由 于 一 级 筛 查 的 阳性 结果 有 可 能 导致 ASD TÉ 
估 的 过度 参 考 、 治 疗 的 延迟 、 父 母 焦虑 的 增加 以 
hn 因此 ， 要 对 于 筛 查 结果 为 阳 
性 的 样本 推荐 进入 二 级 盘查 ， 旨 在 排除 有 其 他 类 
型 发 育 障碍 ， pud M 
自 闭 症 风险 。 本 研究 中 有 8 个 二 级 得 查 工具 , 包 
括 : 两 岁 儿 童 自 闭 症 筛 查 测验 (STAT)、 婴 儿 自 闭 
证 父母 筛 查 (APSD 、 婴 幼儿 自 闭 症 筛 查 第 1 部 分 
(BISCUIT-Part1)、 儿 童 早期 自 闭 症 检测 (ADEC)、 
自 闭 症 心理 状态 检查 (AMSE)、 自 闭 症 追 踪 的 结构 
化 观察 (OERA)、 幼 儿 自 闭 症 快速 互动 第 查 测试 
(RITA-T) 、 发 展 性 登记 (DCD)。 二 级 筛 查 主要 依据 
训练 有 素 的 临床 医生 , 或 是 经 过 培训 的 专业 人 员 
直接 与 儿童 互动 并 观察 结果 (Norris & Lecavalier, 
2010)。 与 一 级 蔓 查 不 同 的 是 ， 二 级 筛 查 的 对 照 组 
儿童 可 区 分 为 两 组 不 同 的 情况 。 第 一 组 包括 由 于 
发 育 问题 已 经 受到 当地 精神 卫生 服务 机 构 关 注 的 
儿童 、 怀 疑 发 育 迟 缓 (DD)、 语 言 障碍 (LD) 的 儿童 ， 
或 符合 非 自 闭 症 谱系 (non-ASD) 标 准 的 儿童 ， 如 
脑 将、 疗 痫 、 唐 氏 综合 征 、 失 明 、 哮 喘 、 过 敏 的 
儿童 ， 这 一 群体 被 确定 为 发 展 关注 组 (DC)， 也 称 
为 低 危 组 (LR)。 第 二 组 包括 患 有 自 闭 症 儿童 的 兄 
弟 姐妹 ， 或 被 一 级 筛 查 为 自 财 症 阳 性 的 儿童 作为 
对 照 组 ， 被 定义 为 遗传 风险 组 (GR)， 因 为 他 们 患 
自 闭 症 的 概率 很 高 (Grenborgetal et al, 2013), 也 称 


ABC 


注 : - 指 该 项 研究 不 需要 进行 文化 适应 性 检验 , \ 指 满足 标题 中 的 1 项 指标 , NR = Not Report 没有 报告 


为 高 危 组 (HR)。 纳 入 二 级 筛 查 的 研究 旨 在 : (a) 通 过 
LR 或 HR 组 来 评价 第 查 工具 的 分 类 准确 性 ; (b) 比 
较 LR 和 HR 组 之 间 的 差异 ; (c) 跟 踪 LR/HR 组 直 
到 确诊 , 通过 减少 假 阳 性 的 数量 来 减少 专门 ASD 
诊断 评估 的 长 等 待 名 单 ; 或 者 ， 最后，(d) 将 普通 
人 和 群 中 的 儿童 与 LR 或 HR 组 进行 比较 。 

根据 研究 所 选用 样本 的 类 型 ， 本 研究 确定 了 
6 项 “混合 "应 用 的 测量 工具 ， 即 : 改良 的 幼儿 自 闭 
证 检查 表 - 有 后 续 随 访 (M-CHATVE); 改良 的 幼儿 
自 财 证 检查 表 - 有 修订 的 后 续 随 访 (M-CHAT-R/F); 
幼儿 自 闭 症 定量 检查 表 (Q-CHAT); 儿童 行为 检查 
表 学 前 儿童 版 (CBCL/1%-5); 三 项 直接 观察 的 自 
闭 症 筛 查 (TIDOS); 自 闭 症 图 片 评估 清单 (PAAS)。 
这 些 混 合 水 平 的 盘查 旨 在 检验 : (a) 将 一 般 人 群 得 
查 工具 应 用 于 临床 样本 的 适当 性 ，(b) 比 较 不 同 来 
源 样本 在 筛 查 工 具 上 的 差异 (ASD 与 ATD 与 
ODD)， 最 后 ，(c) 比 较 一 般 人 和 群 中 的 儿童 (TD) 与 
ASD 诊断 儿童 的 差异 。 
3.2.2 ” 筛 查 工 具 在 心理 测量 特性 上 的 表现 

根据 Cicchetti (1994) 的 指南 ， 分 析 了 筛 查 工 
具 的 内 部 一 致 性 、 稳 定性、 评分 者 间 信 和 度 和 重 测 
信和 度 。 他 们 指出 ， 低 于 克 伦 巴赫 a 系数 0.70 意味 
着 临床 意义 的 水 平 是 不 可 接受 的 ，0.70 到 0.79 R 
示 临 床 意义 水 平 为 一 般 ，0.80 到 0.89 良好 ， 高 于 
0.90 表示 临床 意义 水 平 为 极 好 。Cohen 的 kappa, 
加 权 kappa 和 类 内 相关 (ICC) 被 用 来 衡量 评分 者 之 
间 的 一 致 性 和 重 测 信和 度 。Person FREF (rW 
量 了 独立 评分 者 在 测试 分 数 排序 上 的 相似 性 ， 它 


A 


口 
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也 被 用 来 测量 一 些 研 究 的 可 靠 性 。Kappa 或 ICC 
统计 值 低 于 0.40 表示 临床 意义 较 差 . 介 于 0.40 和 
0.59 之 间 表 示 临 床 意 义 一 般 , 0.60~ 0.74 表示 良好 ， 
0.75 及 以 上 表示 具有 非常 好 的 临床 意义 (Cicchetti 
et al., 1995), 

ANTE FE rp t: TL) f BE UR Z5 RH, A 
12 项 研究 ( 占 35 项 研究 中 的 34%) 使 用 克 伦 巴赫 a 
系数 检验 信和 度 , 但 a 值 在 0.80 以 上 的 工具 只 有 6 
种 : RC ASRS, STAT, M-CHAT-R/F, Q-CHAT, 
ADEC, CBCL/1%-5 的 PDP 量 表 。 评 分 者 信和 度 采 
用 ICC 或 相关 系数 衡量 ， 且 信和 度 值 在 0.75 以 上 的 
工具 有 5 种 :M-CHATR/F STAT, ADEC, TIDOS , 
M-CHAT/F; Kappa 值 检验 评分 者 信和 度 的 有 4 种 工具 ， 
最 高 是 Paula 等 (2018) 研 究 所 采用 的 OERA (0.652~ 
0.978)， 最 低 是 M-CHAT/F (0.42) (Kerub etal., 
2020)。 使 用 重 测 信 度 检验 的 工具 有 5 fb, PDQ-1 
的 重 测 信 和 度 值 最 高 , r= 0.997 (Zahorodny etal., 
2018); CBCL/1%-5 ER M EWA EIK r= 0.085, 
时 间 间 隔 是 8 天 (Narzisi et al., 2013). 
由 于 效 度 的 高 低 没 有 明确 的 标准 ， 不同 效 度 
标准 也 不 一 样 ,我 们 通常 的 最 低 标准 : 效 度 系数 
必须 在 统计 上 有 显著 性 ， 即 此 相关 系数 不 是 来 自 
相关 系数 的 参数 p 为 零 的 全 域 ( 魏 华 忠 , 1995)。 在 
本 研究 纳入 的 35 项 研究 中 ， 有 7 项 ( 占 20%) 研 究 
检验 了 筛 查 工具 的 效 标 效 度 ， 相 关系 数 达到 显著 水 
F, 这 也 是 最 多 使 用 的 效 度 检验 方式 , M-CHAT-R/F, 
ADEC, RITA-T 与 诊断 工具 (ADOS\ CARS) 相 关 在 
0.58~0.849 之 间 ; PDQ-1, OERA 与 效 标 ABC 相关 
0.4~0.869, M-CHAT-R/F 与 效 标 CBCL 的 Pearson 
相关 在 0.37~0.63 之 间 , Q-CHAT 与 效 标 CBCL 的 
spearman p 相关 在 0.29~0.44 之 间 。 有 15 项 ( 占 43%) 
没有 进行 信和 度 和 效 度 检验 。 
3.2.3 ”得 查 工具 在 文化 适应 性 的 表现 

不 同 的 国家 和 文化 背景 会 对 人 类 行为 期 望 有 
着 巨大 的 影响 ,不 同文 化 下 所 界定 的 行为 也 表现 
出 巨大 的 异 质 性 ，ASD 筛 查 工具 开发 和 行为 诊断 
也 因此 受到 极 大 的 挑战 (Wallis & Pinto-Martin, 
2008)。 因 此 ,本 研究 将 筛 查 工 具 的 文化 适应 性 作 
为 一 个 重要 指标 进行 检查 ， 遵 循 既定 的 语言 和 文 
化 等 效 性 准则 ,分 别 从 翻译 、 回 译 、 委 员 会 审查 
和 实地 预测 试 这 四 方面 ,对 每 项 研究 的 文化 适应 
性 进行 独立 评估 (Guillemin et al., 1993; Soto et al., 
2015)。 排 除 13 项 由 英语 国家 开发 并 以 英语 作为 


kay 


测量 语言 的 研究 , 3 项 最 初 是 使 用 非 英语 的 语言 
发 的 也 应 用 于 当地 人 和 群 样本 的 研究 。 最 后 ， 有 19 
项 研究 需要 进行 文化 适应 性 的 检验 , 但 其 中 只 有 
4 项 研究 符合 完整 准则 (Stenberg et al., 2014; 
Magan-Maganto et al., 2020; Tsai et al., 2019; Zhou 
et al., 2018). 3X 4 项 研究 不 仅 说 明了 筛 查 项 目 在 
翻译 、 回 译 上 进行 措辞 和 语言 上 的 调整 ,项 目 也 
经 过 伦理 委员 会 的 审查 ,还 详细 地 报告 了 预测 试 
的 内 容 ， 如 “招募 了 少量 (30 组 家 庭 以 内 ) 家 长 对 工 
具 的 句子 和 措辞 的 适用 性 进行 评估 ,确保 没有 任 
何 误解 等 "。 另 有 6 项 研究 没有 介绍 对 工具 进行 怎 
样 的 修改 ， 既 没有 描述 前 向 的 翻译 , 也 没有 出 现 
或 没有 描述 后 向 的 回 译 ， 其 中 2 项 研究 只 介绍 了 
是 经 过 机 构 委 员 会 审查 的 , 1 项 研究 只 提 到 进行 一 
次 预测 试 , 但 没有 描述 预测 试 的 内 容 和 过 程 ， 见 
表 2。 

值得 强调 的 是 ， 更 广泛 的 文化 适应 性 研究 表 
明 , 需要 以 受 访 者 能 够 理解 或 认为 合适 的 方式 来 
构建 项 目 ， 如 使 用 基于 图 片 的 插图 , 或 使 用 当地 
儿童 的 照片 等 。 例 如 ， 斯里兰卡 的 Perera (2017) 
设计 了 一 种 基于 文化 适应 的 自 闭 症 谱系 障碍 图 形 
第 查 工具 ， 自 闭 症 图 片 评估 清单 (PAAS), 将 陈述 
ASD 主要 特征 的 每 个 项 目 与 一 张 照片 配对 ， 以 提 
高 理解 能 力 。 这 项 新 工具 在 自 闭 症 儿童 、 非 自 闭 
症 发 育 障 碍 儿童 和 普通 儿童 样本 中 进行 了 测试 ， 
表现 出 很 高 的 敏感 性 和 特异 性 (Se = 0.88, Sp = 
0.933)。Janvier 等 (2019) 针 对 服务 不 足 社区 ( 低 收 
A, 少数 民族 家 庭 或 英语 水 平 有 限 的 家 庭 ) 幼 儿 开 
发 的 自 闭 症 筛 查 工 具 ， 发 展 性 登记 (DCD,， 也 是 用 
图 片 来 说 明 目 标 行为 的 一 种 新 的 工具 , 在 交流 、 
游戏 、 社 交 和 行为 4 个 领域 中 设计 了 28 个 项 目 
每 一 个 项 目 都 被 描绘 成 一 幅 线条 图 和 一 张 照 片 。 
在 24~60 个 月 之 间 的 儿童 样本 中 进行 验证 的 结 
表明 ， 它 能 很 好 地 区 分 自 闭 症 谱系 障碍 和 非 自 闭 
症 谱系 障碍 (Se = 0.66, Sp = 0.76)。 
3.2.44 ” 筛 查 工具 符合 诊断 标准 的 表现 
虽然 DSM-5 自 2013 年 颁布 使 用 之 后 得 到 广 
泛 地 应 用 , 在 35 篇 盘查 测量 文章 中 有 12 篇 研究 
是 符合 单独 的 DSM-5 标准 的 ， 占 34%; 而 单独 和 / 
或 使 用 DSM-IV, DSM-IV-TR 的 第 查 研究 有 15 
篇 ， 占 43%, 仍然 占 比 最 大 ， 这 表明 大 多 数 筛 查 
工具 都 遵循 的 是 第 四 版 或 修订 版 本 的 精神 障碍 诊 
断 和 统计 手册 ,而 不 是 现行 DSM-5 手册 的 程序 和 
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指南 。 单 独 参考 ICD-9 和 ICD-10 标准 的 只 有 3 
篇 ， 占 8%; 同时 参考 国际 疾病 分 类 (ICD) 和 美国 
精神 障碍 诊断 和 统计 手册 (DSM) 有 2 项 研究 ， 且 
都 是 样本 超过 1 万 以 上 普通 儿童 参与 的 一 级 得 
查 。 诊断 工具 同时 使 用 自 闭 症 诊断 观察 表 (ADOS) 
和 自 闭 症 诊断 访谈 -修订 版 (ADI-R) 的 研究 有 8 项， 
单独 使 用 ADOS 有 14 项 , 单独 使 用 ADI-R 有 2 
项 。 没 有 报告 诊断 工具 的 有 8 项 ， 见 表 2。 

在 从 科 查 到 诊断 这 段 时 间 内 ， 绝 大 多 数 研究 
同时 收集 了 样本 的 发 育 特征 、 智 商 、 语 言 能 力 与 
情绪 状态 的 数据 ， 目 的 是 将 之 与 临床 判断 结合 使 
用 ， 以 做 出 更 有 效 的 ASD 诊断 (Le Couteur et al., 
2008)。 最 多 使 用 的 发 育 测量 工具 是 穆 伦 早期 学 习 
量 表 (MSEL)， 有 16 项 ; 采用 文 兰 适应 性 行为 量 表 
的 研究 有 9 项 ; 智力 测验 有 6 项 ; 其 他 发 展 量 表 如 ， 


响 。 昌 然 敏感 性 和 特异 性 是 检测 性 能 的 内 在 指标 ， 
但 PPV 和 NPV 对 个 体 家 庭 和 系统 水 平 的 筛 查 评 
价 可 能 具有 更 内 在 的 意义 。 

借鉴 Falkmer 等 (2013) 的 做 法 ， 为 了 评估 两 
个 年 龄 阶段 最 有 辨别 力 的 自 半 症 风险 筛 查 工具 ， 
分 别 将 每 一 种 工具 的 敏感 性 (Se) 和 特异 性 (Sp) 分 
别 合并 产生 了 一 个 正确 分 类 平均 值 , 参考 Cicchetti 
等 (1995) 提 出 的 诊断 准确 性 指标 (敏感 性 、 特 异性 、 
PPV 和 NPV) 指 南 : 差 =< 0.70; 一 般 = 0.70~0.79; 
良好 = 0.80~0.89; 优秀 = 0.90~1.00。 在 婴儿 阶段 
可 以 优先 选取 以 下 3 种 筛 查 工 具 : M-CHAT-R/F , 
STAT、PDQ-1。 根据 图 2 WIA, 这 3 PATA 
的 诊断 准确 性 指标 达到 了 良好 水 平 , 即 Se 与 Sp 


均 大 于 0.8, 


因此 ， 相 较 于 其 他 的 几 种 筛 查 工具 能 


够 提供 更 准确 的 筛 查 结 


果 。 而 在 幼儿 阶段 ， 


贝 利 婴 幼儿 发 
尔 默 修订 的 发 


展 量 表 (BSITD-3) 有 3 项 ; 美 林 - 帕 
展 量 表 (M - PRS) 、 巴 特 尔 发 展 量 表 


第 2 版 BDI-2) 等 共计 9 项 ; 没有 报告 发 育 相关 测 
量 的 研究 有 8 项 。 
3.3 不同 年龄 阶段 筛 查 工具 的 分 类 准确 性 分 析 
根据 心理 学 关于 儿童 心理 发 展 年 龄 阶段 的 划 
分 标准 , 我 们 将 抽样 年 龄 在 0-36 个 月 (3 岁 ) 的 研 
究 纳 入 婴儿 阶段 ， 而 36~72 个 月 (6 岁 ) 的 研究 纳入 
幼儿 阶段 ( 杨 清 ,，1985)， 然 后 详细 地 分 析 每 一 种 得 
查 工 具 的 分 类 准确 性 , 用 以 发 现 不 同年 龄 阶段 得 
查 工具 的 辨别 力 以 及 产生 误导 性 结论 的 可 能 性 。 
本 研究 主要 评估 了 每 种 筛 查 工具 的 4 个 重要 参数 : 
(D 敏 感度 (Sensitivity) 是 指 筛 查 结 果 为 阳性 的 患 
者 比例 , 是 指 ASD 儿童 根据 筛 查 结果 被 正确 识别 
为 "高危 ”的 比例 ; 自 闭 症 谱系 障碍 的 儿童 如 果 没 
有 在 得 查 中 被 识别 出 来 ， 就 会 被 认为 是 假 阴 性 
(False-negative); (2) #¢5¢ VE (Specificity) Æ 4$ fifi & 
结果 为 阴性 的 患者 比例 ， 指 没有 自 闭 症 谱系 障碍 
的 儿童 使 用 筛 查 工 具 被 正确 分 类 为 没有 自 闭 症 谱 
系 障碍 风险 的 比例 ; 没有 自 闭 症 谱系 障碍 的 儿童 ， 
如 果盘 查 呈 阳性 ， 则 被 认为 是 假 阳性 (False- 
positive); (3) 阳 性 预测 值 Positive predictive value, 
PPV) 是 指 得 查 结果 为 阳性 的 个 体 中 患 有 该 疾病 的 
比例 , 即 ASD 诊断 为 ASD 的 比例 除 以 筛 查 呈 阳 
性 的 总 病例 数 。(4) 阴 性 预测 值 (Negative predictive 
value，NPV) 指 筛 查 阴 性 的 儿童 未 被 诊断 为 ASD 
的 比例 。PPV 和 NPV SE 1E TER dt A tr ASD 基 
线 患 病 率 以 及 筛 查 工具 的 敏感 性 和 特异 性 的 影 


OERA, TIDOS 筛 查 工具 的 诊断 准确 性 达到 优秀 
ACE, Bl Se 与 Sp 均 大 于 0.9, 在 对 该 年 龄 阶段 的 
被 试 第 查 时 ， 可 以 优先 选择 这 两 种 筛 查 工具 ,同时 ， 
还 有 6 种 在 幼儿 阶段 的 筛 查 工具 也 达到 了 良好 水 
Æ: RITA-T, T-STAT, RC ASRS, PAAS, 

BISCUIT-Partl 、M-CHATR/F， 见 图 3。 纵 向 比较 
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图 2 婴儿 阶段 自 闭 症 风 险 第 查 工具 的 敏感 性 和 特异 性 
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图 3 幼儿 阶段 自 闭 症 风 险 第 查 工具 的 敏感 性 和 特异 性 
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两 个 年 龄 阶段 的 分 类 准确 性 ,我 们 发 现 ， 幼儿 筛 不 仅 有 助 于 全 面 认识 自 闭 证 筛 查 工具 、 性 能 和 可 
查 工 具 的 准确 率 的 平均 值 (Se = 0.86, Sp = 0.83) 要 能 出 现 的 错误 ， 也 为 盘查 工 具 的 改进 和 创新 提供 
好 于 婴儿 筛 查 工具 (Se = 0.72, Sp = 0.88); HEA HY 了 机 会 


阳性 率 (PPV = 0.80) 也 要 高 于 婴儿 阶段 (PPV = 41 ”规范 工具 的 质量 评估 标准 ， 开 展 持续 的 自 闭 
0.59), 参见 表 3、 表 4。 症 风 险 监 测 和 评估 
zs 本 综述 期 望 回答 的 第 一 个 问题 是 明确 这 些 经 
4 讨论 一 
过 QUADAS-2 质量 评估 后 ， Mew LRM 
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311125 WA iid TSE AS OL 、 应 用 水 平 、 水 平 、 心 理 测 量 学 特性 、 文化 适应 性 和 符合 诊断 
心理 测量 特性 、 文 化 适应 性 、 符 合 诊断 标准 ， 以 标准 等 方面 的 表现 。 首 先 在 筛 查 工具 应 用 方面 ， 
及 分 类 准确 性 方面 评估 了 上 述 18 项 筛 查 工具 ， 这 为 什么 幼儿 阶段 的 第 查 工具 数量 多 ,准确 性 高 


表 3 婴儿 阶段 自 闭 症 风险 筛 查 工 具 的 分 类 准确 性 


AO S | g j 引 ; ME To jl 
工具 名 称 研究 者 年 代 样本 数量 /性 别 ( 男 : 女 ) 敏感 性 。 特异 性 ”阳性 预测 值 阴性 项 测 


/年 龄 平均 值 ) = : PPV {Hi NPV 
M-CHAT(23 项 ) Carbone 等 (2020) 23966/12264:11702 (1 人 性 0.46 0.90 0.31 0.98 
Koh 等 (2014) 别 不 明 )/17.25~26.25 mon 
Stenberg 等 (2014) 
Toh 等 (2018) 
M-CHAT/F Baduel 等 (2017) 5272/2735:2537/16.74~31.7 | 0.62 0.94 0.49 0.99 


Q3 项 ) Guthrie 等 (2019) 6 mon (22.18) 


Kamio 等 (2014) 

Kerub 等 (2020) 
Srisinghasongkram 等 (2016) 
Sturner 等 (2016) 


M-CHAT-R/F ”Coelho-Medeiros 等 (2019) ”6886/3582:3239(259 性 别 不 0.86 0.92 0.35 1.00 
(20 项 ) Guo 等 (2019) 明 )/16~26.5 mon (M = 21.08) 

Magán-Maganto (2020) 

Robins 等 (2014) 


PDQ-1 Zahorodny 等 (2018) 1959/1009:950/18~36 mon 0.8462 0.9984 0.8800 0.9979 
FYI Turner-Brown 等 (2013) 699/343:356/12 mon 0.44 0.99 0.31 0.99 
STAT Wu 等 (2020) 139/91:28/16~24 mon (20 人 — 0.860 0.806 0.803 0.862 
未 参加 随访 ) 
É oss BISCUIT-Partl Horovitz 和 Matson (2014) 1014/684:326(4 人 性别 不 0.9274 0.7593 NR NR 
© 明 )/17~23 mon (M = 20.43) 
Q-CHAT-10 Raza 等 (2019) 172/89:83/18~24 mon 0.73 0.64 0.35 0.90 
CBCL/1%-5 Rescorla 等 (2019) 82/52:30/24 mon ”退缩 0.77 0.97 0.83 0.96 
PDP 0.77 0.99 0.91 0.96 
APSI Sacrey (2018) 283/162:121/6~24 mon 0.62 0.81 0.67 0.78 
小 计 : 10 项 工具 21 项 研究 4047 3101:1937(4 项 研究 性 0.72 0.88 0.59 0.94 


I A fic KR (A )/15.62-26.94 

mon (M - 20.62) 
TE: * 4047 ER 3 中 婴儿 阶段 10 MiA TETTE PEAR Be OPS. Horn 23966 是 使 用 M-CHAT 这 一 筛 查 工具 的 4 项 
研究 样本 量 的 平均 值 ， 包括 Carbone 等 (2020) 的 样本 数量 是 26364, Koh 等 (2014) 的 样本 数量 是 17302, Stenberg 等 (2014) 的 样 
本 数量 是 52026，Toh 等 (2018) 的 样本 数量 是 173。5272 是 使 用 M-CHAT/F 这 一 筛 查 工具 的 6 项 研究 样本 量 的 平均 值 , 包括 
Baduel 等 (2017) 的 样本 数量 是 1250, Guthrie 等 (2019) 的 样本 数量 是 25999, Kamio 等 (2014) 的 样本 数量 是 1851, Kerub 等 (2020) 
的 样本 数量 是 1591，Srisinghasongkram 等 (2016) 的 样本 数量 是 841，Sturner 等 (2016) 的 样本 数量 是 98。6886 是 使 用 
M-CHAT-R/F 这 一 筛 查 工具 的 4 项 研究 样本 量 的 平均 值 ， 包括 Coelho-Medeiros 等 (2019) 的 样本 数量 是 120, Guo 等 (2019) 的 
样本 数量 是 7928, Magán-Maganto 等 (2020) 的 样本 数量 是 3426, Robins 等 (2014) 的 样本 数量 是 16071。 
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表 4 幼儿 阶段 自 闭 症 风险 筛 查 工 具 的 分 类 准确 性 


工具 名 称 研究 者 ， 年 代 样本 数量 /性 别 ( 男 : 女 ) 年 龄 平均 值 ) ”敏感 性 特异 性 PIRE cobi 
M-CHAT Koh 等 (2014) 201/655:546/28.5~42 mon (M=35.25) — 0.70 0.86 0.69 0.92 
Toh 等 (2018) 
M-CHATR/F  Magán-Maganto 等 (2020) 1703/878:825/19.5-34 mon (M = 24.39) 0.81 0.97 0.42 0.99 
Tsai 等 (2019) 
CBCLIV-5 Havdahl 等 (2016) 62/119:43/22.33~55.67 退缩 0.85 0.71 0.82 0.90 
Limberg 等 (2017) mon (M = 44.97) 
Narzisi 等 (2013) PDP 0.91 0.76 0.77 0.90 
RC ASRS Zhou 等 (2018) 918/1056:862/24-60 mon (M = 43.8) 0.886 0.845 NR NR 
Q-CHAT Ruta 等 (2019) 315/206:109/M = 31.6 mon 0.8273 0.7778 NR NR 
TIDOS Oner 等 (2014) 259/179:80/18~60 mon (M = 38) 0.95 0.91 0.85 0.98 
T-STAT Chiang 等 (2013) 30/20:10/24~35 mon (M = 28.41) 0.93 0.87 0.88 0.93 
ADEC Hedley (2015) 96/76:20/12~36 mon (M = 28.67) 0.93 0.64 0.78 0.88 
AMSE Cederlund (2019) 126/96:30/M = 54.4 mon 0.75 0.78 0.95 0.35 
OERA Paula 等 (2018) 99/76:23/36~120 mon (M = 62.04) 0.9275 0.9091 NR NR 
RITA-T Choueiri 和 Wagner (2015) 61/41:20/18~36 mon (M = 26.1) 1 0.84 0.88 1 
BISCUIT-Partl Horovitz 和 Matson (2014) 2048/1461:576(11 人 性别 不 明 )/27.50~ 0.87 0.87 NR NR 
33.50 mon (M = 29.87) 
DCI Janvier 等 (2019) 362/249:113/24~60 mon (M = 38) 0.66 0.76 NR NR 
PAAS Perera 等 (2017) 105/77:28/18~48 mon (M = 36.16) 0.880 0.933 0.952 0.840 
小 计 : 14 项 工具 18 项 研究 (4 项 同 婴 儿 阶段 ) 606'/371:235/22.36~51.97 mon (M = 37.26) 0.86 — 0.83 0.80 0.87 


ik: * 606 ER 4 中 幼儿 阶段 14 项 筛 查 工具 所 涉及 样本 数量 的 平均 值 。 其 中 1201 是 使 用 M-CHAT 这 一 筛 查 工具 的 2 项 研 
究 样 本 量 的 平均 值 , 包括 Koh 等 (2014) 的 样本 数量 是 407, Toh 等 (2018) 的 样本 数量 是 1995。1703 是 使 用 M-CHAT/F 这 一 得 
查 工 具 的 2 项 研究 样本 量 的 平均 值 , 包括 Magán-Maganto 等 (2020) 的 样本 数量 是 3089, Tsai 等 (2019) 的 样本 数量 是 317。162 
是 使 用 CBCL1%-5 这 一 筛 查 工具 的 3 项 研究 样本 量 的 平均 值 ， 包括 Havdahl 等 (2016) 的 样本 数量 是 161, Limberg 等 (2017) 
的 样本 数量 是 183, Narzisi 等 (2013) 的 样本 数量 是 141, 


而 婴儿 阶段 特别 是 低 于 12 个 月 的 筛 查 工具 却 很 儿童 在 12 个 月 后 可 能 会 出 现 很 大 比例 的 发 育 退 
少 ? 可 以 从 两 个 方面 来 分 析 这 一 问题 ,一 方面 ， 化 (Ozonoff et al., 2010)。 因此 , 12 个 月 大 时 漏诊 病 
36 个 月 (3 岁 ) 之 前 发 生 是 自 闭 症 诊断 的 关键 年 龄 ， 例 的 可 能 解释 是 (a) 一 些 儿 童 没有 出 现 ASD 行为 
随 着 年 龄 的 增长 ， 自 闭 症 的 症状 特征 也 日 趋 明 显 ， 指标 , (b) 研 究 人 员 尚 未 确定 12 个 月 大 时 预测 ASD 
因此 , 对 于 3~6 岁 幼儿 的 筛 查 工具 的 开发 和 使 用 最 终 诊 断 的 所 有 关键 行为 指标 ，(c) 研 究 人 员 尚 未 
已 经 为 全 世界 范围 所 共识 ， 这 一 阶段 筛 查 工具 的 找到 基于 家 长 报告 的 能 测量 儿童 关键 行为 的 可 靠 
数量 和 质量 也 是 成 正比 例 的 。 另 一 方面 ， 对 于 24 指标 。 但 是 ， 需 要 强调 的 是 ， 对 于 低 于 12 个 月 得 
个 月 (2 岁 ) 之 前 ， 特 别 是 12 个 月 (1 岁 ) 的 自 闭 症 风 查 为 阳性 或 阴性 的 儿童 都 不 应 仅 视 为 单 点 事件 
险 预 警 的 行为 指标 尚 不 明确 。 尽 管 有 文献 表明 ， (single-point screening event), 需要 开展 更 多 的 基 
许多 儿童 在 12 个 月 前 可 能 出 现 ASD 的 危险 迹象 于 婴儿 家 庭 录 像 (home video) 的 回顾 性 分 析 和 高 
(Zwaigenbaum et al., 2005), 但 其 他 研究 报告 也 称 ， 危 儿 童 的 前 脆性 研究 ， 重 点 探讨 那些 当 单 点 盘查 
35% 至 46% 的 自 闭 症 儿童 有 “ 述 发 "症状 , 这 些 发 被 认为 有 /无 风险 的 儿童 ,至 最 后 成 为 自 闭 症 谱系 / 
现 指出 ,很 早 就 进行 ASD JUS Odi, 但 后 来 并 没 常态 儿童 , 在 其 发 展 轨迹 过 程 中 出 现 了 哪些 问题 ， 
有 发 展 成 ASD 儿童 (Landa et al., 2007; Werner 以 确定 自 闭 症 在 社交 、 交 流 、 行 为 、 运 动 和 气质 
et al，2005)， 也 有 一 些 前 脆性 研究 表明 ， 自 闭 症 等 领域 可 能 是 危险 迹象 的 其 他 行为 ,并 帮助 父母 
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在 12 个 月 之 前 识别 和 确定 自己 婴儿 的 这 些 行为 。 

其 次 , 在 筛 查 工 具 的 心理 测量 学 方面 ,综述 
中 所 涉及 到 35 项 研究 中 只 有 几 个 心理 测量 特性 
比 其 他 特性 更 常 使 用 ， 如 评估 内 部 一 致 性 信和 度 、 
评分 者 信和 度 、 重 测 信 度 和 效 标 效 度 ; 而 分 半 信 度 、 
测量 误差 、 内 容 效 度 、 结 构 效 度 、 跨 文化 效 度 和 
假设 检验 只 在 少数 研究 中 出 现 , 有 1/3 的 研究 根 
本 没有 开展 任何 心理 测量 学 评估 ,这 也 是 造成 心 
理 测量 特性 存在 高 风险 偏 倚 的 主要 原因 之 一 。 还 
有 一 个 非常 常见 的 问题 是 缺失 数据 的 处 理 。 很 少 
有 作者 明确 地 量化 了 自己 研究 数据 集中 缺失 的 数 
据 ， 也 没 人 解释 如 何 处 理 缺 失 数据 ,都 遵循 了 哪 
些 方法 ? 例如 ， 对 于 基于 父母 报告 的 测量 ， 有 可 
能 有 一 些 项 目 是 没有 答案 的 ， 对 于 这 种 特殊 情况 ， 
一 般 通 过 统计 程序 插 补 数据 ,但 这 种 处 理 有 可 能 
改变 数据 结构 和 分 布 , 进而 导致 对 自 闭 症 风 险 的 
高 佑 或 低估 。 因 此 ,对 于 主旨 在 于 识别 自 闭 症 风 
险 早 期 迹象 的 筛 查 研 究 来 说 ， 缺 失 数据 的 处 理 是 
一 个 至 关 重 要 的 方面 ,在 未 来 研究 中 , 研究 人 员 
需要 解释 他 们 是 否 以 及 如 何 处 理 样本 中 缺失 的 数 

。 总 的 说 来 ， 从 我 们 对 筛 查 工 具 的 心理 测量 特 
性 的 检验 结果 可 以 得 出 两 个 主要 的 考虑 因素 ,一 
个 与 心理 测量 评估 的 数量 有 关 ， 另 一 个 与 研究 本 
身 方法 学 质量 有 关 。 而 且 要 着 重 关 注 的 是 第 二 个 
AZ, 与 其 他 研究 相 比 ， 对 第 查 工具 的 研究 普遍 
缺乏 内 容 效 度 的 评 佑 ， 少 量 研究 采用 假设 检验 来 
评估 工具 的 区 分 度 , 但 得 到 方差 分 析 的 结果 较 差 
或 缺少 跨 研 究 进行 衡量 的 统一 标准 。 这 些 发 现 将 
推动 研究 人 员 设 计 验 证 研究 ,重点 要 放 在 提升 得 
查 工 具 的 测量 学 质量 上 。 

第 三 ,在 文化 适应 性 上 ,尽管 金 标 准 的 诊断 
工具 ADOS 和 ADIR 已 被 翻译 成 多 种 语言 ， 并 在 
不 同 的 跨国 环境 中 进行 了 验证 ,但 使 用 这 些 工 具 
需要 花费 大 量 时 间 和 人 金钱。 因此, 在 低 收入 和 中 
等 收入 国家 中 , 金 标准 诊断 工具 的 使 用 明显 滞后 ， 
而 常 采用 具有 广泛 文化 适应 性 验证 的 盘查 工具 ， 
如 M-CHAT 系列 工具 (包括 M-CHAT, M-CHAT/F, 


适合 其 当地 文化 和 语言 的 筛 查 工 具 ， 这 一 趋势 也 
正在 增加 (Stewart & Lee, 2017)。 本 研究 关于 自 闭 
证 风险 筛 查 工具 的 文化 适应 性 结果 显示 ， 大 部 分 
验证 性 研究 对 于 文化 适应 性 的 报道 较为 缺乏 ， 严 
格 控制 的 程度 也 有 很 大 差异 。 因 此 ,我 们 建议 未 
来 研究 需要 更 全 面 地 检查 文化 适应 性 程序 (至 少 
要 包括 翻译 、 回 译 、 委 员 会 审查 和 实地 预测 试 )， 同 
时 还 需要 解决 的 重要 问题 是 ,涉及 文化 或 语言 上 
不 同 的 亚 群体 ， 或 识字 率 较 低 或 没有 识字 能 力 的 
人 ， 有 必要 使 用 经 过 培训 的 双 文化 /双语 个 体 来 管 
理 筛 查 工 具 ， 以 产生 充分 的 理解 。 

在 得 查 工具 的 编制 和 诊断 结果 符合 诊断 标准 
方面 ， 国 际 最 好 的 自 闭 症 谱系 诊断 方法 是 基于 国 
际 疾病 分 类 (ICD) 和 美国 精神 障碍 诊断 和 统计 手 
册 (DSM) 的 框架 ， 使 用 专家 临床 判断 作为 确认 诊 
断 的 “ 金 标准 *"。 尽 管 我 们 检索 的 是 从 2013 年 
DSM-5 发 布 到 2020 年 之 间 的 文献 ， 部 分 自 闭 症 风 
仿 入 查 测量 中 使 用 的 诊断 标准 已 经 最 大 限度 地 遵 
IET DSM-5, 涵盖 了 DSM-5 手册 中 的 A 类 (社会 
互动 和 社会 沟通 ) 和 B 类 (限制 性 和 重复 性 行为 ) 中 
的 至 少 两 个 标准 。 但 是 ， DSM-IV 或 DSM-IV-TR 
的 参考 和 使 用 仍然 占 比 最 多 , 包括 自 闭 症 诊断 观 
察 表 (ADOS)， 以 及 半 结 构 化 的 家 长 访谈 ， 如 自 闭 
症 诊断 访谈 -修订 版 (ADI-R) 也 是 在 2013 年 之 前 
制定 的 ,也 没有 考虑 DSM-5 中 制定 的 指南 。 由 于 

些 使 用 DSM-IV 标准 诊断 为 自 闭 症 的 患者 可 能 
不 属于 DSM-5 的 自 闭 症 患 者 ， 所 以 在 行为 科学 、 
精神 病 学 和 心理 学 领域 中 ,关于 DSM-IV 标准 ( 包 
括 修订 版 ) 和 DSM-5 标准 优越 性 的 争论 也 正 日 趋 
白热化 ， 如 Grzadzinski 等 人 (2013) 研 究 显 示 
DSM-5 对 成 人 和 幼儿 的 敏感 性 降低 ， 而 Sappok 等 
人 (2015) 则 显示 在 DSM-IV 和 DSM-5 48% FY Sif 
查 测量 病例 的 敏感 性 是 相 一 致 的 ， 尽管 特异 性 有 
所 下 降 。 因 此 ， 有 必要 重新 检查 ASD 诊断 和 筛 查 
工具 中 的 问题 和 特征 ， 以 全 面 满 足 DSM-5 的 新 标 
YE. 这 就 需要 将 新 的 ASD 标准 映射 到 筛 查 工具 
使 用 的 项 目 中 ， 同 时 还 要 评估 诊断 过 程 的 工作 方 


= 


M-CHAT-R/F), 经 过 国际 上 广泛 应 用 和 多 种 语言 
中 进行 评估 ，M-CHAT 系列 工具 已 经 表现 出 明显 
的 文化 适应 性 优势 (Guo et al., 2019; Inada et al., 
2011; Seif Eldin et al., 2008), 被 誉 为 最 广泛 使 用 
和 最 著名 的 父母 报告 第 查 工具 。 但 值得 的 注意 的 
是 , 在 低 资源 的 社区 或 国家 背景 下 ， 开 发 和 使 用 


式 ， 这 种 尝试 有 可 能 导致 当前 筛 查 工具 版 本 的 更 
新 。 此 外 ,还 需要 进行 综合 实验 研究 , 使 用 对 照 组 
和 病例 作为 数据 ， 以 便 指导 研究 人 员 、 临 床 医生 、 
精神 病 医 生 和 心理 学 家 使 用 正确 的 筛选 工具 ， 即 
使 在 提出 DSM-5 新 的 变化 之 后 也 能 保持 绩效 。 
尽管 从 研究 和 临床 的 角度 来 看 ， 自 闭 症 早期 
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发 现 的 重要 性 也 已 经 达成 共识 ,但 是 选择 一 种 适 
合 特定 背景 的 筛 查 程序 仍然 困难 重重 ,无论 是 对 
婴 幼 儿 进 行 指定 时 间 点 的 特异 性 盘查 ， 或 者 面向 
健康 婴 幼 儿 没 有 顾虑 的 广 善 性 盘查 ， 无 论 是 通过 
发 育 监 测 和 使 用 正式 筛 查 相 结合 的 方式 ， 或 是 在 
特定 年 龄 使 用 单一 筛 查 并 在 不 同年 龄 段 重复 监测 ， 
任何 选择 除了 参考 如 上 应 用 水 平 、 心 理 测量 特性 、 
文化 适应 性 、 符 合 诊断 标准 等 有 效 性 指标 以 外 ， 


至 关 重 要 的 一 个 问题 是 对 筛 查 结果 应 该 谨慎 解释 ， 


特别 是 临床 医生 要 了 解 如 何 解释 已 经 发 表 的 研究 
数据 ， 如 要 考虑 到 由 于 阴性 病例 没有 得 到 随访 可 
能 会 扭曲 第 查 结果 ,识别 漏诊 病例 的 可 能 性 等 都 
应 仔细 告知 家 长 ， 以 确保 家 庭 纵向 参与 和 后 续 治 
疗 。 我 们 建议 采用 一 种 更 广泛 、 更 平衡 的 方法 来 
说 明 筛 查 结果 ,， 可 以 由 具有 ASD 专门 知识 的 多 学 
科 儿 童 专家 小 组 (一 般 包 括 一 名 能 够 提供 医疗 诊 
断 的 医学 专家 或 临床 心理 学 家 ,及 言语 病理 学 
家 、 职 业 治疗 师 、 医 务 社会 工作 者 等 ) 完 成 ， 更 可 
能 考虑 到 影响 得 查 结果 的 所 有 因素 ， 这 一 多 学 科 
团队 共识 诊断 的 诊 人 断 准确 性 ( 即 随时 间 的 稳定 ) 信 
计 为 80-90% (Woolfenden et al., 2012)。 总 之 , 规 
范 饰 奏 工 具 的 质量 评估 标准 ,在 政策 支持 的 背景 
下 ,开展 这 些 筛 查 管理 和 实用 工具 的 临床 试验 ， 


性 的 ， 他们 可 能 会 低估 或 高 佑 风险 的 早期 迹象 
这 取决 于 他 们 发 现 风险 的 能 力 ， 以 及 区 分 风险 迹 
象 与 正常 偏离 发 展 轨迹 的 能 力 。 问 卷 的 另 一 个 固 
有 局 限 性 是 社会 期 望 偏差 .表现 为 过 度 报告 期 望 
行为 。 

对 比 来 看 ， 只 有 8 项 研究 ( 占 比 23%) 采 用 观察 
法 ， 以 二 级 筛 查 测 量 为 多 见 。 虽 然 观 察 法 的 优点 
特别 明显 ， 如 能 够 获得 更 深入 ,真实 的 资料 ; 适 
合 对 一 些 不 能 使 用 问卷 、 访 谈 法 的 研究 对 象 ， 如 
婴儿 的 个 体 行为 、 活 动 的 研究 , 但 是 受 限于 对 低 
幼儿 童 的 行为 观察 是 一 种 劳动 密集 型 的 任务 , 观 
察 者 只 能 捕获 有 限 的 行为 样本 , 而且 还 需要 考虑 
到 儿童 在 观察 时 的 反应 性 ， 考 虑 到 儿童 与 父母 或 
临床 医生 之 间 的 互动 具有 动态 性 ， 易 出 现 霍 桑 效 
应 等 ,这些 来 自 观 察 员 、 观 察 方式 、 观 察 时 间 和 
地 点 的 影响 都 会 对 观察 质量 产生 干扰 。 因 此 ,对 
观察 者 进行 统一 的 专业 培训 是 减少 研究 误差 ， 确 
保 观 察 信 度 的 重要 手段 ， 而 这 也 正 是 观察 法 的 主 
要 局 限 。 

统 观 问卷 法 和 观察 法 的 局 限 性 ,我 们 发 现 
“改良 的 幼儿 自 闭 症 检查 表 - 有 修订 的 后 续 随访 ” 
(M-CHATR/F) 这 一 筛 查 工具 似乎 可 以 有 效 解 决 
这 一 困境 ， 当 家 长 填写 修订 后 的 20 项 M-CHAT 问 


以 优化 我 们 识别 自 闭 症 谱系 儿童 的 能 力 ， 并 制定 
一 致 性 的 策略 ， 以 便 在 以 后 的 年 龄 持续 地 监测 自 
闭 症 症状 。 
4.2 ”对 照 分 类 准确 性 分 析 数 据 ， 批判 性 选择 自 闭 

症 谱系 风险 筛 查 工具 

第 二 个 研究 问题 是 我 们 希望 根据 QUADAS-2 
的 评估 结果 ,确定 一 个 (或 多 个 ) 用 于 评估 自 闭 症 
的 早期 风险 迹象 的 有 效 第 查 工具 。 我 们 重点 检视 
35 篇 文献 信息 来 源 ， 其 中 有 27 项 研究 采用 由 父母 
或 主要 照顾 者 完成 的 问卷 或 清单 来 收集 信息 和 数 
据 ， 占 比 779, "ll M-CHAT 系列 检查 表 。 这 主要 
是 由 问卷 本 身 所 固有 的 优点 所 致 。 首 先 ， 问 卷 调 
查 所 需 时 间 很 短 ， 不 需要 特定 的 知识 或 培训 ， 侵 
入 性 要 比 观察 检查 表 或 访谈 小 得 多 。 其 次 ,通常 
不 需要 对 问卷 的 编码 系统 或 分 数 解释 进行 专门 培 
训 。 对 于 许多 问卷 来 说 ， 最 终 得 分 的 插 补 和 意义 
的 归纳 也 不 涉及 任何 ASD 的 临床 解释 或 具体 知 
识 。 然 而 ,调查 问 卷 有 几 个 局 限 性 。 首 先 ， 分 数 取 
决 于 信息 提供 者 的 主观 性 。 由 于 调查 问卷 主要 是 
为 父母 设计 的 , 但 父母 的 回顾 性 报告 是 缺乏 准确 


48, MAREE, 需要 进一步 参与 结构 化 的 
随访 访谈 和 /或 面谈 ,在 一 项 针对 16 至 31 个 月 大 
的 幼儿 的 大 样本 美国 研究 中 , 使 用 M-CHAT-R/F 
a ee 
HE 45 例 /10000), x? = 8.63; p = 0.003 (Chlebowski 
et al., 2013)。 

结合 分 类 准确 性 分 析 的 数据 结果 ， 我们 发 现 
M-CHAT-R/F 分 别 在 婴儿 阶段 和 幼儿 阶段 也 保持 
了 良好 的 辨别 水 平 ， 这 也 表明 其 可 能 是 目前 最 具 
潜力 的 自 闭 症 谱系 盘查 工具 之 一 。 值 得 注意 的 是 ， 
虽然 如 上 这 些 筛 查 工具 都 很 有 希望 , 但 目前 并 没 
有 一 项 可 以 被 认为 是 早期 发 现 ASD 风险 的 金 标 
准 ， 这 一 领域 的 研究 和 发 展 还 有 很 大 的 进取 空间 。 


5 研究 局 限 与 展望 


本 综述 有 两 个 局 限 性 。 首 先 , 我 们 采用 的 
QUADAS-2 是 一 种 评估 研究 方法 学 质量 的 标准 化 
方案 ， TEE: LEGE. 因此 对 
QUADAS-2 评估 方案 自身 质量 的 信心 是 确定 其 评 
估 结 果 是 否 可 靠 和 可 信 的 第 一 步 , 换言之 , 评估 
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方案 中 所 划 定 的 评价 标准 的 数量 和 质量 可 以 决定 
评价 结果 中 存在 偏差 的 水 平 高 低 。 例 如 ,我 们 的 
质量 评价 标准 中 没有 考虑 “研究 类 型 ”( 根 据 筛 查 
研究 的 研究 性 质 ， 可 分 为 “验证 研究 、 标 准 化 测 
量 、 跨 文化 比较 、 纵 向 或 后 续 研 究 ”4 个 子 指标 ) 
这 一 审查 维度 ， 这 也 导致 后 期 文献 梳理 过 程 中 无 
法 根据 “文化 适应 性 ”的 指标 来 全 面 衡 量 每 一 项 研 
究 。 同 时 ， 本 综述 还 缺乏 对 于 “流程 和 时 间 ? 方 面 的 
间 倚 风险 评价 指标 。 因 此 ， 对 于 应 用 QUADAS-2 
来 评估 研究 的 测量 特性 ， 进 而 评估 得 查 工具 的 测 
量 特性 ,我 们 建议 未 来 的 筛 查 工 具 研究 需要 采取 
严格 的 质量 分 析 审 查 方案 ， 如 包括 一 个 流程 图 ， 
介绍 关于 被 试 招募 方法 、 样 本 、 测 试 执行 顺序 、 
随访 以 及 与 过 程 相 关 的 其 他 细节 的 信息 ， 以 提高 
可 复制 性 ， 并 更 好 地 告知 读者 潜在 的 偏 倚 。 

第 二 , QUADAS-2 的 方案 采用 的 是 最 差 计 分 
原则 ， 且 缺少 可 降低 论文 异 质 性 数据 分 析 的 统计 
学 分 析 ， 这 些 都 可 能 会 导致 对 某 些 工具 使 用 的 负 
面 偏见 。 由 于 QUADAS-2 本 身 的 特点 在 于 其 方案 
中 的 每 一 项 都 是 整体 评估 的 重要 组 成 部 分 因此 
任何 项 目的 差 评 都 应 被 视 为 严重 缺陷 。 例 如 ,我 
们 将 样本 量 二 100 HÈ, 50-99 为 良 , 30-49 为 可 , < 
30 为 差 (Terwee et al., 2012)。 对 于 一 般 人 群 时 ， 这 


时 间 消 耗 和 NPYV 性 能 等 ， 以 进一步 确定 性 能 最 好 
的 工具 ,其 次 , 在 筛 查 工具 的 引进 和 管理 上 ， 面 对 
国内 ASD 早期 第 查 与 诊断 技术 仍 比 较 滞后 的 现 
状 , 在 鼓励 引进 国际 通用 的 自 闭 症 诊断 工具 
ADOS 和 ADI-R 的 同时 , 支持 自主 研发 符合 国际 
标准 (ICD-11、DSM-5) 的 本 土 化 自 闭 症 诊断 工具 
更 要 加 大 对 公共 卫生 学 、 医 学 心理 学 、 儿 科 保 健 
等 多 学 科 专 业 人 员 的 培训 力度 ， Sese EU LI E 
介 系 统 职能 ， 扩 大 专门 小 组 进行 早期 诊断 和 康复 
干预 的 能 力 。 第 三 个 建议 是 一 个 受到 Covid- 19 的 
传播 而 变 得 突出 的 现实 问题 ,病毒 的 传播 及 其 毁 
灭 性 的 后 果 导 致 了 公共 卫生 社区 服务 处 于 隔离 状 
态 、 父 母 怀 疑 孩子 有 发 育 问 题 时 寻求 专业 意见 的 
可 能 性 下 降 、 面 对 面 康复 服务 可 及 性 降低 ， 因 此 ， 
开发 和 使 用 基于 机 器 学 习 智 能 算法 的 新 型 ASD 
的 自我 管理 工具 ， 如 自 闭 症 指纹 (Autism Fingerprint) 
(Klein et al.，2015) 、 自 闭 症 谱系 障碍 盘查 APP 
(ASD Tests) (Thabtah，2019)， 通 过 使 用 机 器 学 习 
算法 生成 的 分 类 器 计算 筛 查 的 敏感 性 和 特异 性 来 
保障 得 查 的 准确 性 ,由 专业 医疗 中 心 发 布 的 医疗 
报告 来 确诊 正规 诊断 状态 来 实现 远程 保健 服务 ， 
这 些 基 于 移动 应 用 程序 的 筛 查 方式 不 仅 为 家 庭 提 
供 一 个 可 靠 和 易于 使 用 的 工具 来 得 查 他 们 的 孩子 


种 分 类 是 一 个 很 好 的 标准 ， 而 当 考 虑 到 自 闭 症 风 
险 和 /或 临床 组 时 ， 则 应 根据 ASD 的 患 病 率 仔细 
考虑 这 一 样本 量 划分 指标 可 能 并 不 适当 。 另 外 
对 分 类 准确 性 的 评价 指标 , 我 们 只 考虑 了 敏感 性 
和 特异 性 的 合并 平均 值 进行 每 一 项 工具 的 横向 比 
较 , 而 根据 层次 综合 被 试 工作 特征 曲线 (Hierarchical 
Summary Receive Operating Charateristic, HSROC) 
模型 ， 敏 感性 和 特异 性 之 间 可 能 是 非 线 性 的 关系 
(Sánchez-García et al.，2019)， 可 以 采用 贝 叶 斯 层 
次 模型 来 调整 自 闭 证 筛 查 工具 的 不 完善 性 (Rutter 
& Gatsonis, 2001)， 可 以 更 严格 地 检查 抽样 的 变异 
性 和 纳入 论文 之 间 的 异 质 性 ， 以 确保 分 析 结 果 的 
准确 性 ， 这些 问题 应 被 视 为 当前 研究 的 局 限 性 。 
在 过 去 的 七 年 里 ,与 自 财 症 症 状 描述 及 筛 查 
相关 的 研究 呈 上 升 趋势 。 本 综述 以 上 列 出 的 是 常 
见 的 ASD 筛 查 工具 ,未 来 研究 仍然 需要 许多 利益 
相关 者 的 参与 和 有 效 合 作 ， 增 强 对 筛 查 过 程 进行 
深度 的 比较 ， 如 继续 搜索 有 辨别 力 的 筛 查 项 目 内 
容 或 行为 、 参 与 租 查 预测 试 、 计 算 分 数 、 解 释 和 
解释 测试 结果 的 标准 化 ， 如何 处 理 进 一 步 的 转 介 ， 


是 否 患 有 自 闭 症 , 更 有 助 于 用 户 和 健康 社区 克服 
fa PS RAS HY DL o 
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Early screening tools for Autism Spectrum Disorder in infancy and toddlers 
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CHEN Guanghua , TAO Guanpeng , ZHAI Luyu , BAI Xuejun 
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Abstract: The current study provides a systematic review of screening tools for the early detection of 
autism in infants and preschool children. A total of thirty-five empirical studies including infants (nine 
screening tools for a total of 159, 388 children in the sample), and toddlers (14 screening tools for 11, 712 
children) met criteria for inclusion. The Quality Assessment of Diagnostic Accuracy Studies-2 (QUADAS-2) 
checklist was applied to provide a comprehensive understanding for the early identification of autism 
spectrum risk. The M-CHAT-R/F and PDQ-1 among all other screening tools were rated as good for infants; 
OERA and TIDOS were evaluated as excellent tools for young children. The classification accuracy of 
screening tools in early childhood was higher than that in infancy. The M-CHAT-R/F showed as one of the 
most promising measures. Lastly, we discussed the methodological limitations of QUADAS-2, and 
emphasized the importance of standardization of the evaluation of screening tools and the necessity of 
further validation studies for all the measures. 


Key words: autism spectrum disorder, screening tools, the diagnostic sensitivity and specificity, QUADAS-2 


第 4 期 陈 光 华 等 : 自 闭 症 谱系 障碍 的 早期 得 查 工具 


附录 一 : 进行 全 文 审查 的 质量 评估 标准 及 评分 要 求 


圈 出 你 的 
评分 的 具体 问题 (注意 事项 ) 评估 意见 
Yesl| No0 
1 是 否 明确 描述 (或 引用 ) 关 于 “ 筛 查 ” 为 主题 的 测试 ? 1 | 0 
2 是 否 以 谱系 患者 为 代表 作为 接受 检测 患者 筛 查 的 目的 ? i [nii 
(对 于 残疾 儿童 的 研究 ,考虑 是 否 可 能 代表 较 大 的 残疾 人 群 ,或 者 样本 是 否 在 某 些 方面 存在 显著 差异 ) 
3 是 否 明 确 描述 了 筛 查 被 试 的 标准 ? s 
样本 大 小 在 大 于 30 以 上 保留 ， 如 低 于 30 以 下 可 以 备注 册 除 
4 筛 查 的 结果 需要 有 明确 的 ASD 诊断 , 诊断 的 参考 标准 是 否 符合 正确 分 类 目标 条 件 ? (诊断 应 包括 以 下 内 容 之 一 : 
A. 基于 DSM-IV/DSM-5/ICD-10 的 临床 诊断 +ADI-R+ADOS 
B. 基于 DSM-IV/DSM-5/ICD-10 的 临床 诊断 +ADOS 和 /或 ADI-R ABD 
C. [基于 DSM-IV/DSM-5/ICD-10 的 临床 诊断 + 其 他 ] 或 [ADOS/ADI-R+ 其 他 , 如 SRS, CARS, SCQ, CAST, ASSQ 
8X STAT, M-CHAT 等 ] 
D. 仅 基 于 DSM-IV/DSM-5/ICD-10 的 临床 诊断 或 仅 ADOS, 或 仅 ADI-R) 
5 是 否 筛 查 的 参考 标准 独立 于 测试 ? 
(iA TANS PK, 发明 者 与 年 代 , 工具 的 构成 和 评分 标准 ,评分 的 要 求 和 截止 值 ， 筛 查 程序 ， 如 质量 标记 、 时 | 1 | 0 
间 、 成 本 等 ) 
6 是否 对 执行 筛 查 测试 的 过 程 描述 得 足够 详细 ， 以 允许 复制 筛 查 测试 ? 
(明确 地 介绍 了 筛 查 的 管理 及 过 程 性 的 内 容 ,如 : 地 点 ， 筛 查 者 ， 筛 查 时 间 ， 筛 查 人 员 的 身份 , 专业 背景 、 经 过 额 | 1 | 0 
外 培训 和 学 术 水 平等 。) 
7 当 测试 结果 被 解释 为 在 实践 中 使 用 测试 时 , 是 否 有 相同 的 临床 数据 可 用 ( 筛 查 和 诊断 之 间 的 时 间 间 隔 是 否 足够 )? 1 | 0 
8 是 否 解释 了 退出 研究 的 原因 (入 组 后 )? 1 | 0 
9 是 否 明 确 报告 了 筛 查 工具 的 心理 学 测量 属性 计算 方法 /数据 ? ilg 
Qui: 评分 者 信和 度 ， 内 部 一 致 性 信和 度 ， 分 半 信 度 , 重 测 信和 度 ; 效 标 效 度 ， 内 容 效 度 ， 结 构 效 度 等 。) 
10 是 否 明确 报告 了 筛 查 工具 的 分 类 准确 性 计算 方法 /数据 ? e 
(如 : 敏感 性 ,特异 性 ， 阳 性 (PPV)， 阴 性 (NPV)， 至少 要 包括 敏感 性 ,特异 性 ) 


附录 二 : 文中 涉及 的 英文 缩写 之 原文 和 中 文 翻译 


ASD = 自 闭 症 谱系 障碍 (Autism Spectrum Disorder) 
GS = 普通 样本 (General Sample ) 

CS = 临床 样本 (Clinical Sample ) 

ATD = 非典 型 性 发 展 (atypically developing) 

TD = 典型 性 发 展 (typically developing ) 
NCR= 未 提出 任何 问题 (no concerns raised ) 

OPD = 其 他 精神 障碍 (Other Psychiatric Disorders) 
LR = 低 危 (low risk) 

HR = 高 危 (high risk) 

K = Kappa 

A= WE a 系数 Cronbach's a 

p= Spearman 秩 相 关系 数 
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NR = 未 报告 Not Report) 

ICD-9 = 《国际 疾病 分 类 》the International Classification of Disease-9 [ 世 卫 组 织 , 1992 4E] 

ICD-10 = 《国际 疾病 分 类 ) the International Classification of Disease-10[ 志 卫 组 织 , 1992 4E] 

DSM-IV = 《精神 障碍 诊断 和 统计 手册 》 第 四 版 (the Diagnostic and Statistical Manual of Mental 
Disorders—fourth edition) [美国 精神 病 学 协会 , 1994 年 ] 

DSM-IV-TR = 《精神 障碍 诊断 和 统计 手册 》 第 四 版 修订 版 (the Diagnostic and Statistical Manual of Mental 
Disorders—fourth edition-text revision)[ 美 国 精 神 病 学 协会 , 2000 4E] 

DSM-5 = 《精神 障碍 诊断 和 统计 手册 》 第 五 版 (the Diagnostic and Statistical Manual of Mental Disorders, 
5th Edition)[ 美 国 精神 病 学 协会 , 2013 年 ] 

ADI-R = 自 闭 症 诊断 访谈 修订 版 (Autism Diagnostic Interview-Revised) 

ADOS = 自 闭 症 诊断 观察 表 (Autism Diagnostic Observation Schedule) 

DSM-PDP = 普遍 性 发 展 问 题 (Diagnostic and Statistical Manual of Mental Disorders-Pervasive 
Developmental Problems) 

DISCO-11 = 社交 和 沟通 障碍 诊断 访谈 (the Diagnostic Interview for Social and Communication 
Disorders- 11) 


ABC = 自 闭 症 行为 检查 表 (Autism Behavior Checklist) 

ASQ-3 = 年 龄 和 阶段 问卷 第 三 版 (Ages and Stages Questionnaires, Third Edition) 

ASQ-SE = 年 龄 和 阶段 问卷 : 社会 情绪 (Ages and Stages Questionnaires: Social-Emotional) 

ASRS = 自 闭 症 谱系 评定 量 表 (the autism spectrum rating scale) 

BASC-2 = 儿童 行为 评估 系统 -2(Behavioral Assessment System for Children-2) 

Bayley III = BSITD-3 = 贝 利 婴 幼儿 发 展 量 表 第 三 版 (Bayley Scales of Infant and Toddler Development, 
Third Edition) 

BDI-2 = 巴特 尔 发 展 量 表 第 2 版 (developmental profiles from the Battelle Developmental Inventory—2nd 
Edition) 

CBCL/1%-5 = 1.5-5 岁 儿 童 行为 筛 查 表 (Child behavior checklist) 

CDI = 麦克 阿 瑟 - 贝 区 交际 发 展 量 表 (The MacArthur-Bates Communicative Development Inventory) 

CARS-2 = 儿童 孤独 症 评定 量 表 第 二 版 (Social Responsiveness Scale-Preschool) 

CARS 2-ST = 儿童 孤独 症 评 定量 表 第 二 版 ,标准 版 (Social Responsiveness Scale-2 Standard) 

CAT/CLAMS = 认 知 适应 性 测试 /临床 语言 和 听觉 里 程 碑 量 表 (the Cognitive Adaptive Test/Clinical 
Linguistic and Auditory Milestone Scale) 

CPRS-R = 康 纳 斯 父母 评定 量 表 修订 版 (the Conners’ Parent Rating Scale-Revised) 

Denver II = DDST-II = 和 丹佛 发 育 筛 查 测试 第 二 版 The Denver Developmental Screening Test II 

DAS-I = 差异 能 力量 表 第 二 版 (the Differential Ability Scales-Second Edition) 

DCQ = 发 展 问题 问卷 (Developmental Concerns Questionnaire) 

EADT = Enjoji 分析 发 展 测 验 (Enjojis Analytical Developmental Test) 

GDS = MHRA ffit (Global Developmental Screening) 

GMDS = 格 里 菲 斯 智力 发 展 量 表 (the Griffiths Mental Development Scales) 

MASC = 儿童 多 维 焦虑 量 表 (the Multidimensional Anxiety Scale for Children) 

M-PRS = 美 林 - 帕 尔 默 修订 的 发 展 量 表 (Merrill-Palmer 一 Revised Scales of Development ) 

MSEL = 穆 伦 早期 学 习 量 表 (Mullen Scales of Early Learning) 

PEP-R = 心理 教育 概况 修订 版 (Psychoeducational Profile-Revised) 


SCAS = 斯 彭 斯 儿童 焦虑 量 表 (the Spence Children’s Anxiety Scale) 
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SON-R 2 %-7 = SON-R 非 语言 智力 


测试 (Snijders-Oomen Nonverbal Intelligence test ) 


SRS-P = 社会 反应 量 表 - 学 龄 前 儿 站 


Eh (the Social Responsiveness Scale-Preschool Version) 


TASI = 幼儿 自 闭 症 症状 访谈 (Toddler Autism Symptom Interview) 

TBIS = Tanaka 比 奈 智力 量 表 (Tanaka Binet Intelligence Scale) 

VABS = 文 兰 适应 性 行为 量 表 (Vineland Adaptive Behavior Scale) 

Vineland-II = Vineland 适应 性 行为 量 表 第 二 版 (the Vineland Adaptive Behaviour Scales—Second Edition) 
WISC-HI = 韦 氏 儿童 智力 量 表 第 三 版 (Wechsler Intelligence Scale for Children, third edition) 


WPPSI—III = 韦 克 斯 勒 学 前 和 小 学 智力 量 表 第 三 版 (the Wechsler Preschool and Primary Scale of 


Intelligence—Third Edition) 


